Kapitel 7. Umgang mit Daten und Zeiten
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
7.0 Einleitung
Daten und Zeiten (Datumszeiten), wie z. B. der Zeitpunkt eines bestimmten Verkaufs oder das Datum einer öffentlichen Gesundheitsstatistik, werden bei der Vorverarbeitung für maschinelles Lernen häufig angetroffen. Längsschnittdaten (oder Zeitreihendaten) sind Daten, die wiederholt für dieselben Variablen zu bestimmten Zeitpunkten erhoben werden. In diesem Kapitel werden wir eine Reihe von Strategien für den Umgang mit Zeitreihendaten entwickeln, einschließlich des Umgangs mit Zeitzonen und der Erstellung verzögerter Zeitmerkmale. Dabei konzentrieren wir uns auf die Zeitreihen-Tools in der Bibliothek pandas , die die Funktionen vieler anderer allgemeiner Bibliotheken wie datetime
zentralisiert.
7.1 Konvertierung von Strings in Daten
Problem
Wenn du einen Vektor von Strings hast, die Daten und Zeiten darstellen, willst du sie in Zeitreihendaten umwandeln.
Lösung
Verwende pandas' to_datetime
mit dem Format des Datums und/oder der Uhrzeit, das im Parameter format
angegeben ist:
# Load libraries
import
numpy
as
np
import
pandas
as
pd
# Create strings
date_strings
=
np
.
array
([
'03-04-2005 11:35 PM'
,
'23-05-2010 12:01 AM'
,
'04-09-2009 09:09 PM'
])
# Convert to datetimes
[
pd
.
to_datetime
(
date
,
format
=
'
%d
-
%m
-
%Y
%I:
%M
%p'
)
for
date
in
date_strings
]
[Timestamp('2005-04-03 23:35:00'), Timestamp('2010-05-23 ...
Get Maschinelles Lernen mit Python Kochbuch, 2. now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.