Kapitel 14. Indizierung und Auswahl von Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Teil II haben wir uns Methoden und Werkzeuge für den Zugriff auf, das Setzen und Ändern von Werten in NumPy-Arrays angesehen. Dazu gehörten die Indizierung (z. B. arr[2, 1]), das Slicing (z. B.arr[:, 1:5]), die Maskierung (z. B. arr[arr > 0]), die ausgefallene Indizierung (z. B.arr[0, [1, 5]]) und Kombinationen daraus (z. B. arr[:, [1, 5]]). Hier werden wir uns ähnliche Möglichkeiten für den Zugriff auf und das Ändern von Werten in Pandas Series und DataFrame Objekten ansehen. Wenn du die NumPy-Muster verwendet hast, werden dir die entsprechenden Muster in Pandas sehr vertraut vorkommen, auch wenn es ein paar Besonderheiten gibt, die du beachten solltest.

Wir beginnen mit dem einfachen Fall des eindimensionalenSeries Objekts und gehen dann zu dem komplizierteren zweidimensionalen DataFrame Objekt über.

Datenauswahl in Serie

Wie du im vorherigen Kapitel gesehen hast, verhält sich ein Series Objekt in vielerlei Hinsicht wie ein eindimensionales NumPy-Array und in vielerlei Hinsicht wie ein Standard-Python-Wörterbuch. Wenn du dir diese beiden sich überschneidenden Analogien vor Augen hältst, wird es dir helfen, die Muster der Datenindizierung und -auswahl in diesen Arrays zu verstehen.

Serien als Wörterbuch

Wie ein Wörterbuch bietet das Series Objekt eine Zuordnung von einer Sammlung von Schlüsseln ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.