Kapitel 18. Kombinieren von Datensätzen: concat und append

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Einige der interessantesten Untersuchungen von Daten entstehen durch die Kombination verschiedener Datenquellen. Diese Operationen können von der einfachen Verkettung zweier verschiedener Datensätze bis hin zu komplizierteren datenbankähnlichen Joins und Merges reichen, bei denen alle Überschneidungen zwischen den Datensätzen korrekt behandelt werden. Series und DataFramewurden speziell für diese Art von Operationen entwickelt, und Pandas enthält Funktionen und Methoden, die diese Art der Datenverarbeitung schnell und einfach machen.

Hier sehen wir uns eine einfache Verkettung von Seriesund DataFramemit der Funktion pd.concat an. Später werden wir uns mit anspruchsvolleren In-Memory-Merges und Joins beschäftigen, die in Pandas implementiert sind.

Wir beginnen mit den Standardimporten:

In [1]: import pandas as pd
        import numpy as np

Der Einfachheit halber definieren wir diese Funktion, die eineDataFrame in einer bestimmten Form erstellt, die in den folgenden Beispielen nützlich sein wird:

In [2]: def make_df(cols, ind):
            """Quickly make a DataFrame"""
            data = {c: [str(c) + str(i) for i in ind]
                    for c in cols}
            return pd.DataFrame(data, ind)

        # example DataFrame
        make_df('ABC', range(3))
Out[2]:     A   B   C
        0  A0  B0  C0
        1  A1  B1  C1
        2  A2  B2  C2

Außerdem werden wir eine schnelle Klasse erstellen, mit der wir ...

Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.