Kapitel 21. Pivot-Tabellen
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Wir haben gesehen, wie wir mit der groupby
Abstraktion Beziehungen innerhalb eines Datensatzes untersuchen können. Eine Pivot-Tabelle ist eine ähnliche Operation, die häufig in Tabellenkalkulationen und anderen Programmen verwendet wird, die mit tabellarischen Daten arbeiten. Die Pivot-Tabelle nimmt einfache spaltenweise Daten als Eingabe und gruppiert die Einträge in einer zweidimensionalen Tabelle, die eine mehrdimensionale Zusammenfassung der Daten liefert. Der Unterschied zwischen Pivot-Tabellen und groupby
kann manchmal für Verwirrung sorgen; mir hilft es, mir Pivot-Tabellen im Wesentlichen als eine multidimensionale Version der groupby
Aggregation vorzustellen. Das heißt, du teilst auf - wendest an - kombinierst, aber sowohl die Aufteilung als auch die Kombination erfolgen nicht über einen eindimensionalen Index, sondern über ein zweidimensionales Gitter.
Motivierende Pivot-Tabellen
Für die Beispiele in diesem Abschnitt verwenden wir die Datenbank der Passagiere der Titanic, die über die Seaborn-Bibliothek verfügbar ist (sieheKapitel 36):
In
[
1
]:
import
numpy
as
np
import
pandas
as
pd
import
seaborn
as
sns
titanic
=
sns
.
load_dataset
(
'titanic'
)
In
[
2
]:
titanic
.
head
()
Out
[
2
]:
survived
pclass
sex
age
sibsp
parch
fare
embarked
class
\0 0 3
male
22.0
1
0
7.2500
S
Third
1
1
1
female
38.0
1
0
71.2833
C
First
2
1
3
female ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.