Kapitel 5: Überanpassung erkennen und vermeiden
Fundamentale Konzepte:
-
Verallgemeinerungsfähigkeit
-
Anpassung und Überanpassung
-
Steuerung der Komplexität
Exemplarische Verfahren:
-
Kreuzvalidierung
-
Merkmalsauswahl
-
Bäume »stutzen«
-
Regularisierung
Überanpassung und Verallgemeinerungsfähigkeit gehören zu den wichtigsten Konzepten der Data Science. Wenn wir bei der Suche nach Mustern in einer bestimmten Datenmenge genügend Flexibilität zulassen, werden wir auch Muster finden. Leider sind diese »Muster« womöglich nur rein zufällig in den Daten vorhanden. Wie bereits erwähnt, suchen wir jedoch nach Mustern, die sich verallgemeinern lassen – die es ermöglichen, Vorhersagen für unbekannte Instanzen zu treffen. Das Auffinden von Zufallstreffern ...
Get Data Science für Unternehmen - Data Mining und datenanalytisches Denken praktisch anwenden now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.