6Cluster-Analyse

The probability of winning the lottery is slightly greater if you buy a ticket.

Yellin’s Law

Im Folgenden befassen wir uns mit Verfahren, die Objekte zu geeigneten Mengen (Clustern) zusammenfassen (vgl. Abschnitte 3.1 und 4.6). Die Clusteranalyse gehört zum unüberwachten Lernen (Abschnitt 2.6).

Die Grundannahme dabei ist, dass ähnliche Objekte sich durch einen geringeren Abstand als unähnliche auszeichnen. Wir werden folglich ein Abstandsmaß voraussetzen, mit dessen Hilfe wir die Ähnlichkeit von Objekten quantifizieren können. Abstandsmaße wurden im Abschnitt 2.3 behandelt. Eine gute Einführung in Cluster-Verfahren findet man auch in [HKP12].

6.1Arten der Cluster-Analyse

Cluster-Verfahren lassen sich in vier Unterklassen einteilen: ...

Get Data Mining, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.