Anhang A. Einführung in die Infrastruktur für maschinelles Lernen

Dieser Anhang gibt eine kurze Einführung in einige der nützlichsten Infrastruktur-Tools für maschinelles Lernen: Container in Form von Docker oder Kubernetes. Auch wenn dies der Punkt ist, an dem du deine Pipeline an ein Team für Softwareentwicklung übergibst, ist es für jeden, der Pipelines für maschinelles Lernen erstellt, nützlich, diese Tools zu kennen.

Was ist ein Container?

Alle Linux-Betriebssysteme basieren auf dem Dateisystem, also der Verzeichnisstruktur, die alle Festplatten und Partitionen enthält. Von der Wurzel dieses Dateisystems ( /) aus kannst du auf fast alle Aspekte eines Linux-Systems zugreifen. Container erstellen ein neues, kleineres Stammverzeichnis und verwenden es als "kleineres Linux" innerhalb eines größeren Hosts. Auf diese Weise kannst du einen ganz eigenen Satz von Bibliotheken für einen bestimmten Container verwenden. Außerdem kannst du mit Containern Ressourcen wie CPU-Zeit oder Speicher für jeden Container kontrollieren.

Docker ist eine benutzerfreundliche API, die Container verwaltet. Mit Docker können Container erstellt, verpackt, gespeichert und mehrfach eingesetzt werden. Es ermöglicht Entwicklern auch, Container lokal zu erstellen und sie dann in einer zentralen Registry zu veröffentlichen, aus der andere den Container abrufen und sofort ausführen können.

Die Verwaltung von Abhängigkeiten ist ein wichtiges Thema beim maschinellen Lernen und in der Datenwissenschaft. Egal, ob ...

Get Aufbau von Pipelines für maschinelles Lernen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.