Kapitel 4: Gut geeignete Trainingsdatenmengen: Datenvorverarbeitung
Die Qualität der Daten sowie der Umfang der darin enthaltenen Informationen sind entscheidende Faktoren, die festlegen, wie gut ein Lernalgorithmus daraus lernen kann. Daher ist es absolut unverzichtbar, eine Datensammlung zu untersuchen und vorzuverarbeiten, bevor wir einen Lernalgorithmus damit füttern. In diesem Kapitel werden wir wichtige Verfahren zur Datenvorverarbeitung erörtern, die es ermöglichen sollen, gut funktionierende Lernmodelle zu entwickeln.
Die Themen in diesem Kapitel:
Unvollständige Werte aus der Datensammlung entfernen und fehlende Werte ergänzen
Aufbereitung kategorialer Daten für Lernalgorithmen
Auswahl der für die Modellentwicklung maßgeblichen Merkmale ...
Get Machine Learning mit Python und Keras, TensorFlow 2 und Scikit-Learn now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.