Skip to Content
Data-Science-Crashkurs
book

Data-Science-Crashkurs

by Steffen Herbold
January 2022
Intermediate to advanced
346 pages
9h
German
dpunkt
Content preview from Data-Science-Crashkurs

6.7.2Anzahl der Cluster

Eine weitere Stärke von DBSCAN und SLINK besteht darin, dass man die Anzahl der Cluster nicht vorgeben muss, sondern sich diese automatisch aufgrund der Dichte der Daten und der gewählten Parameter ergibt. Beim EM-Clustering gibt es mit dem BIC ein analytisches Kriterium, mit dem man das Optimum bestimmen kann. Bei k-Means ist eine manuelle Analyse zwingend erforderlich, zum Beispiel mit der WSS. Hier gibt es kein hartes Kriterium, anhand dessen man einen guten Wert für k aus dem Liniendiagramm der WSS ablesen kann, stattdessen ist die Erfahrung gefragt, um relevante Änderungen in der Steigung zu erkennen.

6.7.3Ausführungszeit

Die Ausführungszeit kann, je nach Größe des Datensatzes und Anwendungsfall, ein entscheidendes ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Sketchnotes in der IT

Sketchnotes in der IT

Lisa Maria Moritz
Das DevOps-Handbuch

Das DevOps-Handbuch

Jez Humble, John Willis, Gene Kim, Patrick Debois
Projektmanagement kurz & gut

Projektmanagement kurz & gut

Daniel Brönimann, Christoph Bommer

Publisher Resources

ISBN: 9781098130343