Traitement du langage naturel appliqué à l'entreprise
by Ankur A. Patel, Ajay Uppili Arasanipalai
Chapitre 7. Les transformateurs
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Dans le chapitre précédent, nous avons abordé les RNN, l'architecture de modélisation en vogue dans le domaine du NLP jusqu'à ce que l'architecture Transformer prenne de l'importance.
Les transformateurs sont le cheval de bataille de la PNL moderne. L'architecture originale, proposée pour la première fois en 2017, a pris le monde (de l'apprentissage profond) d'assaut. Depuis, la littérature sur la PNL a été inondée de toutes sortes de nouvelles architectures qui sont globalement classées soit dans les personnages de Sesame Street, soit dans les mots qui se terminent par "-former."1
Dans ce chapitre, nous examinerons en détail cette architecture - le transformateur. Nous analyserons les principales innovations et explorerons une nouvelle catégorie de couches de réseaux neuronaux en vogue : le mécanisme d'attention.
Construire un transformateur à partir de zéro
Dans les chapitres 2 et 3, nous avons exploré comment utiliser les transformateurs dans la pratique et comment tirer parti des transformateurs pré-entraînés pour résoudre des problèmes complexes de PNL. Maintenant, nous allons faire une plongée en profondeur dans l'architecture elle-même et apprendre comment les transformateurs fonctionnent à partir des premiers principes.
Que signifient les "premiers principes" ? Eh bien, pour commencer, cela signifie que nous ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access