Capítulo 5. Redes neuronales convolucionales

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo trataremos las redes neuronales convolucionales (CNN). Las CNN son la arquitectura de red neuronal estándar utilizada para la predicción cuando las observaciones de entrada son imágenes, lo que ocurre en una amplia gama de aplicaciones de redes neuronales. Hasta ahora en el libro, nos hemos centrado exclusivamente en las redes neuronales totalmente conectadas, que implementamos como una serie de capas Dense. Así pues, empezaremos este capítulo repasando algunos elementos clave de estas redes y utilizaremos esto para motivar por qué podríamos querer utilizar una arquitectura diferente para las imágenes. A continuación, trataremos las CNN de forma similar a como hemos introducido otros conceptos en este libro: primero discutiremos cómo funcionan a un alto nivel, luego pasaremos a discutirlas a un nivel inferior y, por último, mostraremos en detalle cómo funcionan codificando la operación de convolución desde cero.1 Al final de este capítulo, tendrás un conocimiento lo suficientemente profundo de cómo funcionan las CNN como para poder utilizarlas tanto para resolver problemas como para aprender por tu cuenta variantes avanzadas de CNN, como ResNets, DenseNets y Octave Convolutions.

Redes neuronales y aprendizaje de representación

Las redes neuronales reciben inicialmente datos sobre observaciones, y cada ...

Get Aprendizaje profundo desde cero now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.