Kapitel 13. Einführung in Pandas-Objekte
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Auf einer sehr grundlegenden Ebene kann man sich Pandas-Objekte als erweiterte Versionen von strukturierten NumPy-Arrays vorstellen, bei denen die Zeilen und Spalten mit Beschriftungen und nicht mit einfachen Integer-Indizes gekennzeichnet sind. Wie wir im Laufe dieses Kapitels sehen werden, bietet Pandas eine Vielzahl nützlicher Werkzeuge, Methoden und Funktionen zusätzlich zu den grundlegenden Datenstrukturen, aber für fast alles, was folgt, muss man wissen, was diese Strukturen sind. Bevor wir also weitermachen, wollen wir einen Blick auf die drei grundlegenden Datenstrukturen von Pandas werfen:Series
, DataFrame
und Index
.
Wir beginnen unsere Codesitzungen mit den Standardimporten von NumPy und Pandas:
In
[
1
]:
import
numpy
as
np
import
pandas
as
pd
Das Objekt der Pandas-Serie
Ein Pandas Series
ist ein eindimensionales Array mit indizierten Daten. Es kann wie folgt aus einer Liste oder einem Array erstellt werden:
In
[
2
]:
data
=
pd
.
Series
([
0.25
,
0.5
,
0.75
,
1.0
])
data
Out
[
2
]:
0
0.25
1
0.50
2
0.75
3
1.00
dtype
:
float64
Das Series
kombiniert eine Folge von Werten mit einer expliziten Folge von Indizes, auf die wir mit den Attributen values
und index
zugreifen können. Die values
sind einfach ein vertrautes NumPy-Array:
In
[
3
]:
data
.
values
Out
[
3
]:
array
([
0.25
,
0.5
,
0.75
,
1.
])
index
ist ein Array-ähnliches ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.