Statistiques pratiques pour les scientifiques des données, 2e édition.
by Peter Bruce, Andrew Bruce, Peter Gedeck
Chapitre 7. Apprentissage non supervisé
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Le terme apprentissage non supervisé fait référence aux méthodes statistiques qui permettent d'extraire le sens des données sans former un modèle sur des données étiquetées (données où un résultat d'intérêt est connu). Dans les chapitres 4 à 6, l'objectif est de construire un modèle (ensemble de règles) pour prédire une variable de réponse à partir d'un ensemble de variables de prédiction. Il s'agit de l'apprentissage supervisé. En revanche, l'apprentissage non supervisé construit également un modèle de données, mais il ne fait pas la distinction entre une variable de réponse et des variables prédictives.
L'apprentissage non supervisé peut être utilisé pour atteindre différents objectifs.Dans certains cas, il peut être utilisé pour créer une règle prédictive en l'absence d'une réponse étiquetée.Les méthodes deregroupement peuvent être utilisées pour identifier des groupes de données significatifs. Par exemple, en utilisant les clics web et les données démographiques d'un utilisateur sur un site web, nous pouvons être en mesure de regrouper différents types d'utilisateurs. Le site web peut alors être personnalisé en fonction de ces différents types d'utilisateurs.
Dans d'autres cas, l'objectif peut être de réduire la dimension des données à un ensemble de variables plus facile à gérer.Cet ensemble réduit peut ...