Chapitre 4. Classification des textes
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Une tâche courante dans le traitement du langage naturel est la classification. L'objectif de cette tâche est d'entraîner un modèle à attribuer une étiquette ou une classe à un texte d'entrée (voir figure 4-1). La classification des textes est utilisée dans le monde entier pour un large éventail d'applications, de l'analyse des sentiments et de la détection des intentions à l'extraction d'entités et à la détection du langage. L'impact des modèles de langage, qu'ils soient représentatifs ou génératifs, sur la classification ne peut être sous-estimé.
Figure 4-1. Utilisation d'un modèle linguistique pour classer un texte.
Dans ce chapitre, nous aborderons plusieurs façons d'utiliser les modèles de langage pour classer les textes. Il servira d'introduction accessible à l'utilisation de modèles de langage déjà entraînés. En raison du vaste domaine de la classification des textes, nous discuterons de plusieurs techniques et les utiliserons pour explorer le champ des modèles de langage :
-
"Classification de textes avec des modèles de représentation" démontre la flexibilité des modèles non génératifs pour la classification. Nous couvrirons à la fois les modèles spécifiques à une tâche et les modèles d'intégration.