K-Means-Clusteranalyse

Hierarchische Clusteranalysen haben als Ergebnis einen hübschen Baum, aber auch ein paar Nachteile. Die Baumansicht teilt die Daten nicht direkt ohne zusätzliche Arbeit in einzelne Gruppen auf, und der Algorithmus ist extrem rechenaufwendig. Da die Beziehung zwischen jedem Paar von Elementen und auch bei jeder Verschmelzung von Elementen berechnen werden muss, ist der Algorithmus bei sehr großen Datenmengen langsam.

Eine alternative Clustermethode ist die K-Means-Clusteranalyse. Diese Art von Algorithmus unterscheidet sich vom hierarchischen Clustern sehr, da ihm im Voraus mitgeteilt wird, wie viele verschiedene Cluster zu erzeugen sind. Der Algorithmus bestimmt dann die Größe der Cluster auf Basis der Datenstruktur.

Die K-Means-Clusteranalyse ...

Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.