Kapitel 13. Einführung in Pandas-Objekte

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Auf einer sehr grundlegenden Ebene kann man sich Pandas-Objekte als erweiterte Versionen von strukturierten NumPy-Arrays vorstellen, bei denen die Zeilen und Spalten mit Beschriftungen und nicht mit einfachen Integer-Indizes gekennzeichnet sind. Wie wir im Laufe dieses Kapitels sehen werden, bietet Pandas eine Vielzahl nützlicher Werkzeuge, Methoden und Funktionen zusätzlich zu den grundlegenden Datenstrukturen, aber für fast alles, was folgt, muss man wissen, was diese Strukturen sind. Bevor wir also weitermachen, wollen wir einen Blick auf die drei grundlegenden Datenstrukturen von Pandas werfen:Series, DataFrame und Index.

Wir beginnen unsere Codesitzungen mit den Standardimporten von NumPy und Pandas:

In [1]: import numpy as np
        import pandas as pd

Das Objekt der Pandas-Serie

Ein Pandas Series ist ein eindimensionales Array mit indizierten Daten. Es kann wie folgt aus einer Liste oder einem Array erstellt werden:

In [2]: data = pd.Series([0.25, 0.5, 0.75, 1.0])
        data
Out[2]: 0    0.25
        1    0.50
        2    0.75
        3    1.00
        dtype: float64

Das Series kombiniert eine Folge von Werten mit einer expliziten Folge von Indizes, auf die wir mit den Attributen values und index zugreifen können. Die values sind einfach ein vertrautes NumPy-Array:

In [3]: data.values
Out[3]: array([0.25, 0.5 , 0.75, 1.  ])

index ist ein Array-ähnliches ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.