March 2019
Intermediate to advanced
256 pages
4h 57m
French
Le regroupement/clustering (ou encore partitionnement) est une technique d’apprentissage machine non supervisé qui cherche à distribuer un lot de données en plusieurs cohortes. Cette approche est non supervisée au sens où elle n’a aucun label à disposition dans le modèle ; elle ne peut qu’inspecter les caractéristiques pour en déduire quels échantillons sont similaires et peuvent être regroupés dans la même grappe ou paquet (cluster). Nous allons découvrir dans ce chapitre, la méthode des k-moyennes et celle des regroupements hiérarchiques. Nous utiliserons comme jeu de données d’exemple le jeu Titanic.
Pour créer des grappes avec l’algorithme k-moyennes, l’utilisateur doit choisir un nombre k de ...
Read now
Unlock full access