CHAPITRE 7 Travailler avec des données textuelles

Dans le Chapitre 4, nous avons vu deux types de caractéristiques qui peuvent représenter des propriétés de la donnée : des caractéristiques continues, qui représentent une quantité, et des caractéristiques catégorielles (ou qualitatives), qui sont des éléments d’une certaine liste. Il existe une troisième catégorie qui se rencontre dans de nombreuses applications : le texte. Par exemple, si nous voulons classifier un message électronique pour le ranger dans l’un des dossiers Boîte de réception ou Courrier indésirable, le contenu de cet e-mail va certainement contenir des informations importantes pour cette tâche. Dans le cas d’un service apporté aux clients, nous voulons très souvent détecter automatiquement ...

Get Le Machine learning avec Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.