Kapitel 8. Unüberwachtes Lernen: Clustering
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Im vorigen Kapitel haben wir uns mit der Dimensionalitätsreduzierung beschäftigt, die eine Art des unbeaufsichtigten Lernens ist. In diesem Kapitel befassen wir uns mit dem Clustering, einer Kategorie unbeaufsichtigter Lerntechniken, die es uns ermöglicht, versteckte Strukturen in Daten zu entdecken.
Sowohl das Clustering als auch die Dimensionalitätsreduktion fassen die Daten zusammen. Bei der Dimensionalitätsreduktion werden die Daten komprimiert, indem sie mit neuen, weniger Merkmalen dargestellt werden, wobei die wichtigsten Informationen erhalten bleiben. Ähnlich ist das Clustering eine Möglichkeit, die Datenmenge zu reduzieren und Muster zu finden. Dies geschieht jedoch durch die Kategorisierung der ursprünglichen Daten und nicht durch die Erstellung neuer Variablen. Clustering-Algorithmen ordnen Beobachtungen Untergruppen zu, die aus ähnlichen Datenpunkten bestehen. Das Ziel des Clustering ist es, eine natürliche Gruppierung in den Daten zu finden, so dass die Datenpunkte eines bestimmten Clusters einander ähnlicher sind als die eines anderen Clusters. Das Clustering dient dazu, die Daten besser zu verstehen, indem man mehrere Kategorien oder Gruppen bildet. Es ermöglicht auch die automatische Kategorisierung neuer Objekte nach den erlernten Kriterien.
Im Finanzbereich wird das Clustering von Händlern ...
Get Maschinelles Lernen und Data Science Blueprints für Finanzen now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.