Kapitel 5: Überanpassung erkennen und vermeiden

Fundamentale Konzepte:

  • Verallgemeinerungsfähigkeit

  • Anpassung und Überanpassung

  • Steuerung der Komplexität

Exemplarische Verfahren:

  • Kreuzvalidierung

  • Merkmalsauswahl

  • Bäume »stutzen«

  • Regularisierung

Überanpassung und Verallgemeinerungsfähigkeit gehören zu den wichtigsten Konzepten der Data Science. Wenn wir bei der Suche nach Mustern in einer bestimmten Datenmenge genügend Flexibilität zulassen, werden wir auch Muster finden. Leider sind diese »Muster« womöglich nur rein zufällig in den Daten vorhanden. Wie bereits erwähnt, suchen wir jedoch nach Mustern, die sich verallgemeinern lassen – die es ermöglichen, Vorhersagen für unbekannte Instanzen zu treffen. Das Auffinden von Zufallstreffern ...

Get Data Science für Unternehmen - Data Mining und datenanalytisches Denken praktisch anwenden now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.