Kapitel 7. Umgang mit Daten und Zeiten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

7.0 Einleitung

Daten und Zeiten (Datumszeiten), wie z. B. der Zeitpunkt eines bestimmten Verkaufs oder das Datum einer öffentlichen Gesundheitsstatistik, werden bei der Vorverarbeitung für maschinelles Lernen häufig angetroffen. Längsschnittdaten (oder Zeitreihendaten) sind Daten, die wiederholt für dieselben Variablen zu bestimmten Zeitpunkten erhoben werden. In diesem Kapitel werden wir eine Reihe von Strategien für den Umgang mit Zeitreihendaten entwickeln, einschließlich des Umgangs mit Zeitzonen und der Erstellung verzögerter Zeitmerkmale. Dabei konzentrieren wir uns auf die Zeitreihen-Tools in der Bibliothek pandas , die die Funktionen vieler anderer allgemeiner Bibliotheken wie datetime zentralisiert.

7.1 Konvertierung von Strings in Daten

Problem

Wenn du einen Vektor von Strings hast, die Daten und Zeiten darstellen, willst du sie in Zeitreihendaten umwandeln.

Lösung

Verwende pandas' to_datetime mit dem Format des Datums und/oder der Uhrzeit, das im Parameter format angegeben ist:

# Load libraries
import numpy as np
import pandas as pd

# Create strings
date_strings = np.array(['03-04-2005 11:35 PM',
                         '23-05-2010 12:01 AM',
                         '04-09-2009 09:09 PM'])

# Convert to datetimes
[pd.to_datetime(date, format='%d-%m-%Y %I:%M %p') for date in date_strings]
[Timestamp('2005-04-03 23:35:00'), Timestamp('2010-05-23 ...

Get Maschinelles Lernen mit Python Kochbuch, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.