Kapitel 11. Verwaltung desLebenszyklus des maschinellen Lernensmit MLflow
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In dem Maße, wie maschinelles Lernen in allen Branchen an Bedeutung gewinnt und in Produktionsumgebungen eingesetzt wird, steigt auch der Grad der Zusammenarbeit und die Komplexität, die damit einhergeht. Zum Glück gibt es inzwischen Plattformen und Tools, die dabei helfen, den Lebenszyklus des maschinellen Lernens strukturiert zu verwalten. Eine dieser Plattformen, die gut mit PySpark zusammenarbeitet, ist MLflow. In diesem Kapitel zeigen wir, wie MLflow mit PySpark genutzt werden kann. Außerdem stellen wir dir wichtige Praktiken vor, die du in deinen Data Science-Workflow einbauen kannst.
Wir fangen nicht bei Null an, sondern bauen auf der Arbeit auf, die wir in Kapitel 4 geleistet haben. Wir werden unsere Entscheidungsbaum-Implementierung unter Verwendung des Covtype-Datensatzes wieder aufgreifen. Nur dass wir dieses Mal MLflow für die Verwaltung des Lebenszyklus des maschinellen Lernens verwenden.
Wir beginnen mit einer Erklärung der Herausforderungen und Prozesse, die den Lebenszyklus des maschinellen Lernens ausmachen. Dann stellen wir MLflow und seine Komponenten vor und erläutern die Unterstützung von MLflow für PySpark. Danach folgt eine Einführung in die Verfolgung von Trainingsläufen für maschinelles Lernen mit MLflow. Dann lernen wir, wie wir Machine-Learning-Modelle ...
Get Erweiterte Analytik mit PySpark now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.