Skip to Content
Aufbau von Pipelines für maschinelles Lernen
book

Aufbau von Pipelines für maschinelles Lernen

by Hannes Hapke, Catherine Nelson
September 2024
Intermediate to advanced
366 pages
9h 58m
German
O'Reilly Media, Inc.
Book available
Content preview from Aufbau von Pipelines für maschinelles Lernen

Kapitel 5. Datenvorverarbeitung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Die Daten, die wir zum Trainieren unserer Machine-Learning-Modelle verwenden, werden oft in Formaten bereitgestellt, die unsere Machine-Learning-Modelle nicht verarbeiten können. In unserem Beispielprojekt ist ein Merkmal, das wir zum Trainieren unseres Modells verwenden wollen, nur als Ja- und Nein-Tag verfügbar. Jedes maschinelle Lernmodell benötigt eine numerische Darstellung dieser Werte (z. B. 1 und 0). In diesem Kapitel erklären wir dir, wie du Merkmale in konsistente numerische Darstellungen umwandelst, damit dein Machine Learning Modell mit den numerischen Darstellungen der Merkmale trainiert werden kann.

Ein wichtiger Aspekt, den wir in diesem Kapitel behandeln, ist die konsequente Vorverarbeitung. Wie in Abbildung 5-1 dargestellt, findet die Vorverarbeitung nach der Datenvalidierung statt, die wir in Kapitel 4 besprochen haben. TensorFlow Transform (TFT), die TFX-Komponente für die Datenvorverarbeitung, ermöglicht es uns, unsere Vorverarbeitungsschritte als TensorFlow-Graphen zu erstellen. In den folgenden Abschnitten werden wir erörtern, warum und wann dies ein guter Workflow ist und wie wir die Vorverarbeitungsschritte exportieren. In Kapitel 6 werden wir die vorverarbeiteten Datensätze und den erhaltenen Transformationsgraphen verwenden, um unser maschinelles Lernmodell zu trainieren bzw. zu exportieren. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Trainingsdaten für maschinelles Lernen

Trainingsdaten für maschinelles Lernen

Anthony Sarkis
Maschinelles Lernen für hochriskante Anwendungen

Maschinelles Lernen für hochriskante Anwendungen

Patrick Hall, James Curtis, Parul Pandey

Publisher Resources

ISBN: 9781098191528Supplemental Content