Capítulo 10. Clasificación de imágenes con redes neuronales convolucionales

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

La visión por ordenador es una rama del aprendizaje profundo en la que los ordenadores disciernen información a partir de imágenes. Los usos en el mundo real incluyen la identificación de objetos en fotos, la eliminación de imágenes inapropiadas de las redes sociales, el recuento de los coches en la cola de un peaje y el reconocimiento de caras en fotos. Los modelos de visión computerizada pueden incluso combinarse con modelos de procesamiento del lenguaje natural (PLN) para subtitular fotos. Hice una foto mientras estaba de vacaciones y pedí al servicio de Visión Artificial de Azure que la subtitulara. El resultado se muestra en la Figura 10-1. Es algo extraordinario, dado que no se requirió intervención humana.

Figura 10-1. "Una masa de agua con un muelle y un edificio al fondo"-Azure AI

El campo de la visión por ordenador ha avanzado rápidamente en los últimos años, sobre todo gracias a las redes neuronales convolucionales, también conocidas como CNN o ConvNets. En 2012, una CNN de ocho capas llamada AlexNet superó a los modelos tradicionales de aprendizaje automático presentados al Desafío anual de reconocimiento visual a gran escala de ImageNet (ILSVRC), al lograr una tasa de error ...

Get Aprendizaje Automático Aplicado e IA para Ingenieros now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.