Kapitel 18. Kombinieren von Datensätzen: concat und append
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Einige der interessantesten Untersuchungen von Daten entstehen durch die Kombination verschiedener Datenquellen. Diese Operationen können von der einfachen Verkettung zweier verschiedener Datensätze bis hin zu komplizierteren datenbankähnlichen Joins und Merges reichen, bei denen alle Überschneidungen zwischen den Datensätzen korrekt behandelt werden. Series
und DataFrame
wurden speziell für diese Art von Operationen entwickelt, und Pandas enthält Funktionen und Methoden, die diese Art der Datenverarbeitung schnell und einfach machen.
Hier sehen wir uns eine einfache Verkettung von Series
und DataFrame
mit der Funktion pd.concat
an. Später werden wir uns mit anspruchsvolleren In-Memory-Merges und Joins beschäftigen, die in Pandas implementiert sind.
Wir beginnen mit den Standardimporten:
In
[
1
]:
import
pandas
as
pd
import
numpy
as
np
Der Einfachheit halber definieren wir diese Funktion, die eineDataFrame
in einer bestimmten Form erstellt, die in den folgenden Beispielen nützlich sein wird:
In
[
2
]:
def
make_df
(
cols
,
ind
):
"""Quickly make a DataFrame"""
data
=
{
c
:
[
str
(
c
)
+
str
(
i
)
for
i
in
ind
]
for
c
in
cols
}
return
pd
.
DataFrame
(
data
,
ind
)
# example DataFrame
make_df
(
'ABC'
,
range
(
3
))
Out
[
2
]:
A
B
C
0
A0
B0
C0
1
A1
B1
C1
2
A2
B2
C2
Außerdem werden wir eine schnelle Klasse erstellen, mit der wir ...
Get Python Data Science Handbook, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.