Kapitel 8. Einführung in Pandas

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

pandas ist ein Schlüsselelement in unserer dataviz-Toolchain, da wir es sowohl zum Bereinigen als auch zum Erforschen unseres kürzlich gescrapten Datensatzes verwenden werden (siehe Kapitel 6). Im letzten Kapitel wurde NumPy vorgestellt, die Python-Bibliothek zur Array-Verarbeitung, die die Grundlage für Pandas bildet. Bevor wir mit der Anwendung von Pandas fortfahren, werden in diesem Kapitel die wichtigsten Konzepte vorgestellt und gezeigt, wie Pandas mit bestehenden Datendateien und Datenbanktabellen interagiert. Den Rest deines Pandas-Lernens wirst du in den nächsten Kapiteln in der Praxis erleben.

Warum pandas für Dataviz maßgeschneidert ist

Bei jeder Datenvisualisierung, egal ob webbasiert oder gedruckt, ist die Wahrscheinlichkeit groß, dass die visualisierten Daten irgendwann einmal zeilenweise in einer Tabellenkalkulation wie Excel, einer CSV-Datei oder in HDF5 gespeichert wurden. Es gibt sicherlich Visualisierungen, wie z. B. Netzwerkdiagramme, für die zeilenweise Daten nicht die beste Form sind, aber die sind in der Minderheit. pandas ist mit seinem Kerndatentyp, dem DataFrame, der am besten als sehr schnelle, programmatische Tabellenkalkulation betrachtet werden kann, für die Bearbeitung von zeilenweisen Datentabellen maßgeschneidert.

Warum Pandas entwickelt wurde

Pandas wurde erstmals 2008 von Wes Kinney ...

Get Datenvisualisierung mit Python und JavaScript, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.