Hierarchisches Clustering und Dendrogramme

Das Ergebnis beim agglomerativen Clustering ist ein sogenanntes hierarchisches Clustering. Das Clusterverfahren arbeitet iterativ, sodass jeder Punkt eine Reise vom anfänglichen Ein-Punkt-Cluster bis zu seinem endgültigen Cluster durchlebt. Jeder Zwischenschritt ist eine gültige Zuordnung (einer anderen Anzahl) von Clustern. Manchmal ist es hilfreich, sich alle möglichen Cluster auf einmal anzusehen. Das nächste Beispiel (Abbildung 3-35) zeigt eine Überlagerung aller möglichen Clusterzuordnungen in Abbildung 3-33. Dies gibt uns Aufschluss darüber, wie sich jeder Cluster aus kleineren Clustern zusammensetzt:

In[61]:

mglearn.plots.plot_agglomerative()

Abbildung 3-35: Über agglomeratives Clustering erzeugte ...

Get Einführung in Machine Learning mit Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.