Blueprints d'apprentissage automatique et de science des données pour la finance.
by Hariom Tatsat, Sahil Puri, Brad Lookabaugh
Chapitre 8. Apprentissage non supervisé : Le regroupement
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Dans le chapitre précédent, nous avons exploré la réduction de la dimensionnalité, qui est un type d'apprentissage non supervisé. Dans ce chapitre, nous allons explorer le regroupement, une catégorie de techniques d'apprentissage non supervisé qui nous permet de découvrir des structures cachées dans les données.
Le regroupement et la réduction de la dimensionnalité résument tous deux les données. La réduction de la dimensionnalité compresse les données en les représentant à l'aide de nouvelles caractéristiques moins nombreuses, tout en capturant les informations les plus pertinentes. De même, le regroupement est un moyen de réduire le volume des données et de trouver des modèles. Cependant, il le fait en catégorisant les données d'origine et non en créant de nouvelles variables. Les algorithmes de regroupement assignent les observations à des sous-groupes constitués de points de données similaires. L'objectif du regroupement est de trouver un groupe naturel dans les données de sorte que les éléments d'un groupe donné soient plus semblables les uns aux autres que ceux de groupes différents. Le regroupement permet de mieux comprendre les données à travers la lentille de plusieurs catégories ou groupes créés. Il permet également la catégorisation automatique de nouveaux objets selon les critères ...