Chapitre 6. Réseaux neuronaux récurrents
À l'adresse, ce chapitre traite des réseaux neuronaux récurrents (RNN), une classe d'architectures de réseaux neuronaux conçus pour traiter des séquences de données. Les réseaux neuronaux que nous avons vus jusqu'à présent traitaient chaque lot de données qu'ils recevaient comme un ensemble d'observations indépendantes ; il n'y avait aucune notion selon laquelle certains des chiffres MNIST arrivaient avant ou après les autres chiffres, que ce soit dans les réseaux neuronaux entièrement connectés que nous avons vus au chapitre 4 ou dans les réseaux neuronaux convolutifs que nous avons vus au chapitre 5. Cependant, de nombreux types de données sont intrinsèquement ordonnés, qu'il s'agisse de données de séries temporelles, que l'on peut traiter dans un contexte industriel ou financier, ou de données linguistiques, dans lesquelles les caractères, les mots, les phrases, etc. sont ordonnés. Les réseaux neuronaux récurrents sont conçus pour apprendre à prendre en compte des séquences de données de ce type et à renvoyer une prédiction correcte en sortie, que cette prédiction correcte concerne le prix d'un actif financier le lendemain ou le mot suivant dans une phrase.
Le traitement des données ordonnées nécessitera trois types de changements par rapport aux réseaux neuronaux entièrement connectés que nous avons vus ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access