CHAPITRE 18 Regroupement (clustering)
Le regroupement/clustering (ou encore partitionnement) est une technique d’apprentissage machine non supervisé qui cherche à distribuer un lot de données en plusieurs cohortes. Cette approche est non supervisée au sens où elle n’a aucun label à disposition dans le modèle ; elle ne peut qu’inspecter les caractéristiques pour en déduire quels échantillons sont similaires et peuvent être regroupés dans la même grappe ou paquet (cluster). Nous allons découvrir dans ce chapitre, la méthode des k-moyennes et celle des regroupements hiérarchiques. Nous utiliserons comme jeu de données d’exemple le jeu Titanic.
K-moyennes
Pour créer des grappes avec l’algorithme k-moyennes, l’utilisateur doit choisir un nombre k de ...
Get Machine learning : les fondamentaux now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.