O'Reilly logo

Einführung in Data Science by Joel Grus

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

KAPITEL 19

Clustering

Wo wir solche Cluster hatten, die uns vornehm wild, nicht wahnsinnig werden ließen.

Robert Herrick

Die meisten Algorithmen in diesem Buch gehören in die Kategorie des überwachten Lernens. Sie gehen von einem annotierten Datensatz aus und verwenden diesen als Grundlage für Vorhersagen bei neuen, nicht annotierter Daten. Clustering ist dagegen ein Beispiel für unüberwachtes Lernen, wobei wir ausschließlich mit nicht annotierten Daten arbeiten (oder wenn unsere Daten annotiert sind, ignorieren wir das).

Die Idee

Jedes Mal, wenn Sie eine Datenquelle betrachten, werden die Daten irgendeine Art von Cluster bilden. Ein Datensatz der Wohnorte von Millionären enthält vermutlich Cluster an Orten wie Beverly Hills und Manhattan. ...

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, interactive tutorials, and more.

Start Free Trial

No credit card required