Kapitel 17. Hierarchische Indizierung
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Bis zu diesem Punkt haben wir uns hauptsächlich auf ein- und zweidimensionale Daten konzentriert, die in Pandas Series
bzw.DataFrame
Objekten gespeichert werden. Oft ist es sinnvoll, darüber hinauszugehen und höherdimensionale Daten zu speichern, d. h. Daten, die durch mehr als einen oder zwei Schlüssel indiziert sind. Frühe Pandas-Versionen boten die Objekte Panel
und Panel4D
an, die man sich als 3D- oder 4D-Analoga zum 2D-ObjektDataFrame
vorstellen kann, aber in der Praxis waren sie etwas umständlich zu benutzen. Ein weitaus gängigeres Muster für den Umgang mit höherdimensionalen Daten ist die hierarchische Indizierung (auch bekannt als Multi-Indizierung), bei der mehrere Indexebenen in einem einzigen Index zusammengefasst werden. Auf diese Weise können höherdimensionale Daten kompakt in den bekannten eindimensionalen Series
und zweidimensionalen DataFrame
Objekten dargestellt werden. (Wenn du dich für echte N-dimensionale Arrays mit flexiblen Indizes im Stil von Pandas interessierst, kannst du dir das hervorragendeXarray-Paket ansehen).
In diesem Kapitel geht es um die direkte Erstellung vonMultiIndex
Objekten, um Überlegungen beim Indizieren, Slicen und Berechnen von Statistiken über mehrfach indizierte Daten und um nützliche Routinen für die Konvertierung zwischen einfachen und hierarchisch indizierten Datendarstellungen. ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.