K-Means-Clusteranalyse
Hierarchische Clusteranalysen haben als Ergebnis einen hübschen Baum, aber auch ein paar Nachteile. Die Baumansicht teilt die Daten nicht direkt ohne zusätzliche Arbeit in einzelne Gruppen auf, und der Algorithmus ist extrem rechenaufwendig. Da die Beziehung zwischen jedem Paar von Elementen und auch bei jeder Verschmelzung von Elementen berechnen werden muss, ist der Algorithmus bei sehr großen Datenmengen langsam.
Eine alternative Clustermethode ist die K-Means-Clusteranalyse. Diese Art von Algorithmus unterscheidet sich vom hierarchischen Clustern sehr, da ihm im Voraus mitgeteilt wird, wie viele verschiedene Cluster zu erzeugen sind. Der Algorithmus bestimmt dann die Größe der Cluster auf Basis der Datenstruktur.
Die K-Means-Clusteranalyse ...