KAPITEL 4

Fehlende Daten

Wir werden es mit fehlenden Daten zu tun bekommen. Das vorherige Kapitel hat ein Beispiel dafür gezeigt, und dieses Kapitel wird noch etwas näher darauf eingehen. Die meisten Algorithmen funktionieren nicht, wenn Daten fehlen. Erwähnenswerte Ausnahmen sind die neueren Bibliotheken verstärkender Algorithmen: XGBoost, CatBoost und LightGBM.

Wie so oft beim maschinellen Lernen gibt es auch für den Umgang mit fehlenden Daten keine absoluten Antworten. Zudem kann das Fehlen von Daten unterschiedliche Gründe haben. Stellen Sie sich vor, in den Daten einer Volkszählung fehle eine Altersangabe. Liegt das nun daran, dass die Person ihr Alter nicht preisgeben wollte? Wusste sie es nicht? Hat der Fragesteller vergessen, überhaupt ...

Get Machine Learning – Die Referenz now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.