Capítulo 10. Clasificación de imágenes con redes neuronales convolucionales
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
La visión por ordenador es una rama del aprendizaje profundo en la que los ordenadores disciernen información a partir de imágenes. Los usos en el mundo real incluyen la identificación de objetos en fotos, la eliminación de imágenes inapropiadas de las redes sociales, el recuento de los coches en la cola de un peaje y el reconocimiento de caras en fotos. Los modelos de visión computerizada pueden incluso combinarse con modelos de procesamiento del lenguaje natural (PLN) para subtitular fotos. Hice una foto mientras estaba de vacaciones y pedí al servicio de Visión Artificial de Azure que la subtitulara. El resultado se muestra en la Figura 10-1. Es algo extraordinario, dado que no se requirió intervención humana.
El campo de la visión por ordenador ha avanzado rápidamente en los últimos años, sobre todo gracias a las redes neuronales convolucionales, también conocidas como CNN o ConvNets. En 2012, una CNN de ocho capas llamada AlexNet superó a los modelos tradicionales de aprendizaje automático presentados al Desafío anual de reconocimiento visual a gran escala de ImageNet (ILSVRC), al lograr una tasa de error ...
Get Aprendizaje Automático Aplicado e IA para Ingenieros now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.