Kapitel 11: Verwendung nicht gekennzeichneter Daten: Clusteranalyse
In den vorangegangenen Kapiteln haben wir Verfahren des überwachten Lernens angewendet, um Lernmodelle zu entwickeln, bei denen die Antworten bereits bekannt waren – die Klassenbezeichnungen waren in den Trainingsdaten schon verfügbar. In diesem Kapitel gehen wir einen Schritt weiter und erkunden die Clusteranalyse, ein Verfahren zum unüberwachten Lernen, das es ermöglicht, verborgene Strukturen in Daten aufzuspüren, auch wenn uns die richtigen Antworten nicht bereits vorab bekannt sind. Das Ziel des Clusterings ist es, neue natürliche Gruppen zu finden, sodass die Objekte im selben Cluster eine größere Ähnlichkeit miteinander aufweisen als mit den Objekten in anderen ...
Get Machine Learning mit Python und ScikitLearn und TensorFlow now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.