Rozdział 47. Dogłębne spojrzenie — klasteryzacja za pomocą algorytmu k-średnich

W poprzednich rozdziałach przyglądaliśmy się modelom uczenia nienadzorowanego do redukcji wymiarowości. W tym przejdziemy do innej klasy modeli nienadzorowanych, jaką stanowią algorytmy grupowania. Algorytmy klasteryzacji (grupowania, analizy skupień) starają się na podstawie własności danych przeprowadzić ich optymalny podział lub przypisać im dyskretne etykiety.

W Scikit-Learn oraz w innych pakietach zaimplementowano bardzo wiele algorytmów klasteryzacji. Spośród nich prawdopodobniej najłatwiejszym do zrozumienia jest algorytm znany jako algorytm k-średnich (ang. k-means) lub algorytm centroidów. W Scikit-Learn jego implementację znajdziesz w sklearn.cluster.KMeans ...

Get Python Data Science now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.