Übungen
Andere Nachrichtenquellen. Das Beispiel in diesem Kapitel hat hauptsächlich reine Nachrichtenquellen genutzt. Versuchen Sie, ein paar der bekannten politischen Blogs hinzuzufügen (http://technorati.com ist da ein guter Ausgangspunkt für eine Suche). Wie wirkt sich das auf die Ergebnisse aus? Gibt es Merkmale, die vor allem für politische Kommentare zutreffen? Gibt es Nachrichten, die mit den zugehörigen Kommentaren gruppiert werden?
K-Means-Clusteranalyse. Für die Artikel-Matrix wurde eine hierarchische Clusteranalyse durchgeführt, aber was passiert, wenn Sie eine K-Means-Clusteranalyse durchführen? Wie viele Cluster brauchen Sie, um die verschiedenen Artikel gut trennen zu können? Wie steht das mit der Anzahl an Merkmalen in Zusammenhang, ...