Kapitel 3: Datenbearbeitung mit Pandas

Im letzten Kapitel haben wir uns detailliert mit NumPy und dem ndarray-Objekt befasst, das eine effiziente Speicherung und Bearbeitung von dicht gepackten Arrays (dense typed arrays) in Python ermöglicht. Auf dieses Wissen greifen wir hier zurück, wenn wir die Datenstrukturen der Pandas-Bibliothek ausführlich betrachten. Pandas ist ein neueres Paket, das auf NumPy aufbaut und eine effiziente DataFrame-Implementierung bietet. DataFrames sind im Wesentlichen mehrdimensionale Arrays mit Bezeichnungen für Zeilen und Spalten, die oft ungleichartige Typen und/oder fehlende Daten enthalten. Pandas bietet nicht nur eine komfortable Schnittstelle für das Speichern gekennzeichneter Daten, es implementiert darüber ...

Get Data Science mit Python - Das Handbuch für den Einsatz von Ipython, Jupyter, NumPy, Pandas, Matplotlib, Scikit-Learn now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.