Kapitel 21. Pivot-Tabellen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Wir haben gesehen, wie wir mit der groupby Abstraktion Beziehungen innerhalb eines Datensatzes untersuchen können. Eine Pivot-Tabelle ist eine ähnliche Operation, die häufig in Tabellenkalkulationen und anderen Programmen verwendet wird, die mit tabellarischen Daten arbeiten. Die Pivot-Tabelle nimmt einfache spaltenweise Daten als Eingabe und gruppiert die Einträge in einer zweidimensionalen Tabelle, die eine mehrdimensionale Zusammenfassung der Daten liefert. Der Unterschied zwischen Pivot-Tabellen und groupby kann manchmal für Verwirrung sorgen; mir hilft es, mir Pivot-Tabellen im Wesentlichen als eine multidimensionale Version der groupbyAggregation vorzustellen. Das heißt, du teilst auf - wendest an - kombinierst, aber sowohl die Aufteilung als auch die Kombination erfolgen nicht über einen eindimensionalen Index, sondern über ein zweidimensionales Gitter.

Motivierende Pivot-Tabellen

Für die Beispiele in diesem Abschnitt verwenden wir die Datenbank der Passagiere der Titanic, die über die Seaborn-Bibliothek verfügbar ist (sieheKapitel 36):

In [1]: import numpy as np
        import pandas as pd
        import seaborn as sns
        titanic = sns.load_dataset('titanic')
In [2]: titanic.head()
Out[2]:    survived  pclass     sex   age  sibsp  parch     fare embarked  class  \
        0         0       3    male  22.0      1      0   7.2500        S  Third
        1         1       1  female  38.0      1      0  71.2833        C  First
        2         1       3  female ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.