February 2008
Intermediate to advanced
400 pages
10h
German
Die hierarchische und die K-Means-Clusteranalyse sind beides Techniken zum unüberwachten Lernen, sie erfordern also keine Trainingsdaten, da sie nicht versuchen, Vorhersagen zu treffen. Kapitel 3 hat gezeigt, wie man eine Liste mit Top-Blogs nehmen und sie automatisch so in Gruppen unterteilen kann, dass Sie sehen, welche zusammengehören, weil sie zum Beispiel die gleichen Themen behandeln oder gleiche Wörter verwenden.
Hierarchische Clusteranalyse
Die Clusteranalyse funktioniert mit jeder Sammlung von Elementen, die eine oder mehrere numerische Eigenschaften haben. Das Beispiel in Kapitel 3 hat die Wortfrequenzen der verschiedenen Blogs genutzt, aber man kann ein beliebiges Set von Zahlen zur Clusteranalyse verwenden. Um zu zeigen, ...