Rozdział 20. Grupowanie
Gromadził się nasz Parnas cały
Na tęgo zakrapiane, lecz podniosłe szały
— Robert Herrick
Większość algorytmów przedstawionych w tej książce to algorytmy uczenia nadzorowanego — uczymy je na zbiorze danych oznaczonych etykietami, a następnie używamy ich w celu generowania prognoz dotyczących nowych danych pozbawionych etykiet. Grupowanie (zwane również klastryzacją i analizą skupień) jest przykładem uczenia nienadzorowanego — pracujemy z danymi pozbawionymi etykiety albo z danymi posiadającymi etykiety, ale etykiety te są przez nas ignorowane.
Idea
W zasadzie każde dane da się w jakiś sposób pogrupować. Zbiór danych o miejscach zamieszkania milionerów z pewnością zawiera wiele elementów, które można przyporządkować do Beverly ...
Get Data science od podstaw now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.