Kapitel 4: Gut geeignete Trainingsdatenmengen: Datenvorverarbeitung

Die Qualität der Daten sowie der Umfang der darin enthaltenen Informationen sind entscheidende Faktoren, die festlegen, wie gut ein Lernalgorithmus daraus lernen kann. Daher ist es absolut unverzichtbar, eine Datensammlung zu untersuchen und vorzuverarbeiten, bevor wir einen Lernalgorithmus damit füttern. In diesem Kapitel werden wir wichtige Verfahren zur Datenvorverarbeitung erörtern, die es ermöglichen sollen, gut funktionierende Lernmodelle zu entwickeln.

Die Themen in diesem Kapitel:

Unvollständige Werte aus der Datensammlung entfernen und fehlende Werte zuweisen
Aufbereitung kategorialer Daten für den Lernalgorithmus
Auswahl der für die Modellentwicklung maßgeblichen ...

Get Machine Learning mit Python und ScikitLearn und TensorFlow now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Start your free trial

Machine Learning mit Python und ScikitLearn und TensorFlow by Sebastian Raschka, Vahid Mirjalili

Kapitel 4: Gut geeignete Trainingsdatenmengen: Datenvorverarbeitung

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly