Overview
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Moderne Systeme enthalten Multi-Core-CPUs und GPUs, die das Potenzial für parallele Berechnungen haben. Aber viele wissenschaftliche Python-Tools wurden nicht dafür entwickelt, diese Parallelität zu nutzen. In diesem kurzen, aber gründlichen Buch erfahren Datenwissenschaftler/innen und Python-Programmierer/innen, wie die Open-Source-Bibliothek Dask für paralleles Rechnen APIs bereitstellt, die die Parallelisierung von PyData-Bibliotheken wie NumPy, Pandas und Scikit-Learn erleichtern.
Die Autoren Holden Karau und Mika Kimmins zeigen dir, wie du Dask-Berechnungen in lokalen Systemen nutzen und dann in die Cloud skalieren kannst, um größere Arbeitslasten zu bewältigen. Dieses praktische Buch erklärt, warum Dask bei Branchenexperten und Akademikern beliebt ist und von Unternehmen wie Walmart, Capital One, der Harvard Medical School und der NASA eingesetzt wird.
Mit diesem Buch wirst du lernen:
- Was Dask ist, wo du es einsetzen kannst und wie es im Vergleich zu anderen Tools funktioniert
- Wie du Dask für die parallele Verarbeitung von Batch-Daten nutzt
- Die wichtigsten Konzepte verteilter Systeme für die Arbeit mit Dask
- Methoden zur Verwendung von Dask mit übergeordneten APIs und Bausteinen
- Wie man mit integrierten Bibliotheken wie Scikit-Learn, Pandas und PyTorch arbeitet
- Wie man Dask mit GPUs nutzt