Kapitel 6. Artefakt- und Metadatenspeicher
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Beim maschinellen Lernen geht es in der Regel um eine große Menge an Roh- und Zwischenergebnissen (transformierten) Daten, deren Ziel es ist, ein Modell zu erstellen und einzusetzen. Um unser Modell zu verstehen, müssen wir in der Lage sein, die Datensätze zu untersuchen, die für seine Erstellung und Transformationen verwendet wurden (Data Lineage). Die Sammlung dieser Datensätze und die auf sie angewandte Transformation wird als Metadaten unseres Modells bezeichnet.1
Modell-Metadaten sind entscheidend für die Reproduzierbarkeit beim maschinellen Lernen;2 Die Reproduzierbarkeit ist entscheidend für einen zuverlässigen Produktionseinsatz. Die Erfassung der Metadaten ermöglicht es uns, Abweichungen bei der Wiederholung von Aufträgen oder Experimenten zu verstehen. Das Verständnis von Abweichungen ist notwendig, um unsere Modelle iterativ zu entwickeln und zu verbessern. Außerdem bietet es eine solide Grundlage für Modellvergleiche. Wie Pete Warden es in diesem Beitrag definiert hat:
Um Ergebnisse reproduzieren zu können, müssen Code, Trainingsdaten und die gesamte Plattform genau aufgezeichnet werden.
Die gleichen Informationen werden auch für andere gängige ML-Operationen benötigt - Modellvergleiche, reproduzierbare Modellerstellung usw.
Es gibt viele verschiedene Optionen, um die Metadaten von Modellen ...
Get Kubeflow für maschinelles Lernen now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.