Skip to Content
Skalierung von Python mit Dask
book

Skalierung von Python mit Dask

by Holden Karau, Mika Kimmins
October 2024
Intermediate to advanced
226 pages
6h 6m
German
O'Reilly Media, Inc.
Content preview from Skalierung von Python mit Dask

Anhang B. Skalierbare Datenrahmen: Ein Vergleichund etwas Geschichte

Der verteilte, Pandas-ähnliche Datenrahmen von Dask ist unserer Meinung nach eine der wichtigsten Funktionen. Es gibt verschiedene Ansätze, um skalierbare DataFrame-ähnliche Funktionen bereitzustellen. Einer der wichtigsten Punkte, die Dasks Datenrahmen auszeichnen, ist der hohe Grad an Unterstützung für die Pandas-APIs, den andere Projekte schnell aufholen wollen. Dieser Anhang vergleicht einige der aktuellen und historischen DataFrame-Bibliotheken.

Um die Unterschiede zu verstehen, schauen wir uns ein paar Schlüsselfaktoren an, von denen einige den Techniken ähneln, die wir in Kapitel 8 vorschlagen. Zunächst geht es darum, wie die API aussieht und wie viel von deinen vorhandenen Fähigkeiten und deinem Code mit Pandas übertragen werden kann. Dann schauen wir uns an, wie viel Arbeit auf einem einzelnen Thread, auf dem Treiber/Kopfknoten und dann auf einem einzelnen Arbeitsknoten erledigt werden muss.

Skalierbare Datenrahmen müssen nicht zwangsläufig verteilt sein, auch wenn eine verteilte Skalierung oft eine kostengünstigere Verarbeitung größerer Datenmengen ermöglicht als die Einzelmaschinenoptionen - und bei wirklich großen Datenmengen ist sie die einzige praktische Option.

Werkzeuge

Eine der gemeinsamen Abhängigkeiten , die du in vielen der Tools siehst, ist, dass sie auf ASF Arrow aufbauen. Obwohl Arrow ein fantastisches Projekt ist und wir hoffen, dass es auch weiterhin genutzt wird, gibt es einige Unterschiede ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Der Per Anhalter durch die Python

Der Per Anhalter durch die Python

Kenneth Reitz, Tanya Schlusser
Erweiterte Analytik mit PySpark

Erweiterte Analytik mit PySpark

Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Roboter mit ROS

Roboter mit ROS

Murat Calis
Deep Learning für die Biowissenschaften

Deep Learning für die Biowissenschaften

Bharath Ramsundar, Peter Eastman, Patrick Walters, Vijay Pande

Publisher Resources

ISBN: 9798341606135Supplemental Content