Rozdział 20. Grupowanie

Gromadził się nasz Parnas cały

Na tęgo zakrapiane, lecz podniosłe szały

— Robert Herrick

Większość algorytmów przedstawionych w tej książce to algorytmy uczenia nadzorowanego — uczymy je na zbiorze danych oznaczonych etykietami, a następnie używamy ich w celu generowania prognoz dotyczących nowych danych pozbawionych etykiet. Grupowanie (zwane również klastryzacją i analizą skupień) jest przykładem uczenia nienadzorowanego — pracujemy z danymi pozbawionymi etykiety albo z danymi posiadającymi etykiety, ale etykiety te są przez nas ignorowane.

Idea

W zasadzie każde dane da się w jakiś sposób pogrupować. Zbiór danych o miejscach zamieszkania milionerów z pewnością zawiera wiele elementów, które można przyporządkować do Beverly ...

Get Data science od podstaw now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.