Traitement du langage naturel avec les transformateurs, édition révisée
by Lewis Tunstall, Leandro von Werra, Thomas Wolf
Chapitre 6. Résumé
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
À un moment ou à un autre, tu as probablement eu besoin de résumer un document, qu'il s'agisse d'un article de recherche, d'un rapport sur les résultats financiers ou d'un fil de courriels. Si tu y réfléchis bien, cela requiert toute une série de capacités, telles que la compréhension de longs passages, le raisonnement sur le contenu et la production d'un texte fluide qui incorpore les principaux sujets du document d'origine. De plus, résumer avec précision un article d'actualité est très différent de résumer un contrat juridique, donc être capable de le faire nécessite un degré sophistiqué de généralisation du domaine. Pour ces raisons, le résumé de texte est une tâche difficile pour les modèles de langage neuronaux, y compris les transformateurs. Malgré ces défis, le résumé de texte offre aux experts du domaine la possibilité d'accélérer considérablement leurs flux de travail et est utilisé par les entreprises pour condenser les connaissances internes, résumer les contrats, générer automatiquement du contenu pour les communiqués des médias sociaux,et bien plus encore.
Pour t'aider à comprendre les défis que cela représente, ce chapitre va explorer comment nous pouvons exploiter les transformateurs pré-entraînés pour résumer des documents. Le résumé est une tâche classique de séquence à séquence (seq2seq) avec un texte d'entrée ...