Kapitel 12. Modell Ausbildungsdienst

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bisher haben wir die Transformationspipeline aufgebaut, um Erkenntnisse zu gewinnen, die in ein Unternehmens-Dashboard einfließen können, oder um Daten für eine Anwendung zu verarbeiten, die mit Endkunden geteilt werden kann, usw. Wenn es sich bei den Erkenntnissen um ein ML-Modell handelt, ist ein Modelltraining erforderlich, das in diesem Kapitel behandelt wird. Ein typischer Datenwissenschaftler untersucht während des Trainings Hunderte von Modellkombinationen, um das genaueste Modell zu finden. Dabei werden verschiedene Permutationen von ML-Algorithmen, Hyperparameterwerten und Datenmerkmalen ausprobiert. Das Training von ML-Modellen ist heute mit einigen Herausforderungen verbunden. Erstens kann das Training angesichts der wachsenden Datenmengen und der komplizierten Deep Learning-Modelle Tage und Wochen dauern. Gleichzeitig ist es nicht trivial, die Trainingsorganisation über eine Serverfarm zu verwalten, die aus einer Kombination von CPUs und spezialisierter Hardware wie GPUs besteht. Zweitens beruht die iterative Abstimmung der optimalen Werte für die Modellparameter und Hyperparameter auf der Brute-Force-Suche. Es besteht ein Bedarf an automatisierter Modellabstimmung, einschließlich der Nachverfolgung aller Abstimmungsiterationen und ihrer Ergebnisse. Drittens muss das Modell in Szenarien, in denen ...

Get Die Self-Service-Daten-Roadmap now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.