Kapitel 17. Hierarchische Indizierung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bis zu diesem Punkt haben wir uns hauptsächlich auf ein- und zweidimensionale Daten konzentriert, die in Pandas Series bzw.DataFrame Objekten gespeichert werden. Oft ist es sinnvoll, darüber hinauszugehen und höherdimensionale Daten zu speichern, d. h. Daten, die durch mehr als einen oder zwei Schlüssel indiziert sind. Frühe Pandas-Versionen boten die Objekte Panel und Panel4Dan, die man sich als 3D- oder 4D-Analoga zum 2D-ObjektDataFrame vorstellen kann, aber in der Praxis waren sie etwas umständlich zu benutzen. Ein weitaus gängigeres Muster für den Umgang mit höherdimensionalen Daten ist die hierarchische Indizierung (auch bekannt als Multi-Indizierung), bei der mehrere Indexebenen in einem einzigen Index zusammengefasst werden. Auf diese Weise können höherdimensionale Daten kompakt in den bekannten eindimensionalen Series und zweidimensionalen DataFrame Objekten dargestellt werden. (Wenn du dich für echte N-dimensionale Arrays mit flexiblen Indizes im Stil von Pandas interessierst, kannst du dir das hervorragendeXarray-Paket ansehen).

In diesem Kapitel geht es um die direkte Erstellung vonMultiIndex Objekten, um Überlegungen beim Indizieren, Slicen und Berechnen von Statistiken über mehrfach indizierte Daten und um nützliche Routinen für die Konvertierung zwischen einfachen und hierarchisch indizierten Datendarstellungen. ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.