Kapitel 5: Überanpassung erkennen und vermeiden

Fundamentale Konzepte:

  • Verallgemeinerungsfähigkeit

  • Anpassung und Überanpassung

  • Steuerung der Komplexität

Exemplarische Verfahren:

  • Kreuzvalidierung

  • Merkmalsauswahl

  • Bäume »stutzen«

  • Regularisierung

Überanpassung und Verallgemeinerungsfähigkeit gehören zu den wichtigsten Konzepten der Data Science. Wenn wir bei der Suche nach Mustern in einer bestimmten Datenmenge genügend Flexibilität zulassen, werden wir auch Muster finden. Leider sind diese »Muster« womöglich nur rein zufällig in den Daten vorhanden. Wie bereits erwähnt, suchen wir jedoch nach Mustern, die sich verallgemeinern lassen – die es ermöglichen, Vorhersagen für unbekannte Instanzen zu treffen. Das Auffinden von Zufallstreffern ...

Get Data Science für Unternehmen - Data Mining und datenanalytisches Denken praktisch anwenden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.