Kapitel 4: Gut geeignete Trainingsdatenmengen: Datenvorverarbeitung

Die Qualität der Daten sowie der Umfang der darin enthaltenen Informationen sind entscheidende Faktoren, die festlegen, wie gut ein Lernalgorithmus daraus lernen kann. Daher ist es absolut unverzichtbar, eine Datensammlung zu untersuchen und vorzuverarbeiten, bevor wir einen Lernalgorithmus damit füttern. In diesem Kapitel werden wir wichtige Verfahren zur Datenvorverarbeitung erörtern, die es ermöglichen sollen, gut funktionierende Lernmodelle zu entwickeln.

Die Themen in diesem Kapitel:

  • Unvollständige Werte aus der Datensammlung entfernen und fehlende Werte zuweisen

  • Aufbereitung kategorialer Daten für den Lernalgorithmus

  • Auswahl der für die Modellentwicklung maßgeblichen ...

Get Machine Learning mit Python und ScikitLearn und TensorFlow now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.