Kapitel 13. Kontinuierlicher Integrationsdienst

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bisher haben wir uns mit dem Aufbau der Transformationslogik beschäftigt, um die Erkenntnisse und das Training von ML-Modellen zu implementieren. ML-Modellpipelines werden in der Regel kontinuierlich weiterentwickelt, indem das Quellschema, die Merkmalslogik, abhängige Datensätze, Datenverarbeitungskonfigurationen, Modellalgorithmen, Modellmerkmale und die Konfiguration geändert werden. Diese Änderungen werden von Datennutzer/innen-Teams vorgenommen, um entweder neue Produktfunktionen zu implementieren oder die Genauigkeit der Modelle zu verbessern. In der traditionellen Softwareentwicklung wird der Code ständig aktualisiert, wobei täglich mehrere Änderungen in den Teams vorgenommen werden. Um ML-Modelle in der Produktion einsetzen zu können, werden in diesem Kapitel Details zur kontinuierlichen Integration von ML-Pipelines behandelt, ähnlich wie bei der traditionellen Softwareentwicklung.

Bei der kontinuierlichen Integration von ML-Pipelines gibt es mehrere Probleme. Der erste ist die ganzheitliche Verfolgung von ML-Pipeline-Experimenten mit Daten, Code und Konfiguration. Diese Experimente können als Feature-Zweige betrachtet werden, wobei die große Mehrheit dieser Zweige nie in den Stamm integriert werden wird. Diese Experimente müssen nachverfolgt werden, um die optimale Konfiguration zu finden ...

Get Die Self-Service-Daten-Roadmap now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.