Traitement du langage naturel avec les transformateurs, édition révisée
by Lewis Tunstall, Leandro von Werra, Thomas Wolf
Chapitre 2. Classification des textes
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
La classification de texte est l'une des tâches les plus courantes du NLP ; elle peut être utilisée pour un large éventail d'applications, telles que l'étiquetage des commentaires des clients en catégories ou l'acheminement des tickets d'assistance en fonction de leur langue. Il y a de fortes chances que le filtre anti-spam de ton programme de messagerie utilise la classification de texte pour protéger ta boîte de réception d'un déluge de courrier indésirable !
Un autre type courant de classification de texte est l'analyse des sentiments, qui (comme nous l'avons vu au chapitre 1) vise à identifier la polarité d'un texte donné. Par exemple, une entreprise comme Tesla peut analyser des messages Twitter comme celui de la figure 2-1 pour déterminer si les gens aiment ou non les toits de ses nouvelles voitures.
Figure 2-1. L'analyse du contenu de Twitter peut permettre d'obtenir des commentaires utiles de la part des clients (avec l'aimable autorisation d'Aditya Veluri).
Imagine maintenant que tu es un scientifique des données qui doit construire un système capable d'identifier automatiquement les états émotionnels tels que la "colère" ou la "joie" que les gens expriment à propos du produit de ton entreprise sur Twitter. ...