Chapitre 5. Réseaux neuronaux convolutionnels
À l'adresse ce chapitre, nous aborderons les réseaux neuronaux à convolution (CNN). Les CNN constituent l'architecture de réseau neuronal standard utilisée pour la prédiction lorsque les observations en entrée sont des images, ce qui est le cas dans un large éventail d'applications de réseaux neuronaux. Jusqu'à présent dans le livre, nous nous sommes exclusivement concentrés sur les réseaux neuronaux entièrement connectés, que nous avons implémentés sous la forme d'une série de couches Dense. Ainsi, nous commencerons ce chapitre en passant en revue certains éléments clés de ces réseaux et nous nous en servirons pour motiver les raisons pour lesquelles nous pourrions vouloir utiliser une architecture différente pour les images. Nous aborderons ensuite les CNN de la même manière que nous avons introduit d'autres concepts dans ce livre : nous discuterons d'abord de leur fonctionnement à un niveau élevé, puis à un niveau inférieur, et enfin nous montrerons en détail comment ils fonctionnent en codant l'opération de convolution à partir de zéro.1 À la fin de ce chapitre, tu auras une compréhension suffisamment approfondie du fonctionnement des CNN pour pouvoir les utiliser à la fois pour résoudre des problèmes et pour apprendre par toi-même les variantes avancées des CNN, telles que les ResNets, les DenseNets ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access