Kapitel 11. Zeitfenster-Merkmale für maschinelles Lernen in Echtzeit
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In Kapitel 8 haben wir kurz untersucht, ob wir zeitlich geglättete Merkmale wie den gleitenden Durchschnitt der Verspätung von Taxis am Ausgangsflughafen als Input in das Modell einbeziehen können. Wir stellten fest, dass die zeitlich begrenzten Merkmale den Modellfehler verringerten. Es war jedoch unklar, wie die Kunden (die nur den Flug kennen, auf dem sie sich befinden) den richtigen Wert angeben können. Deshalb haben wir beschlossen, die Zeitfensterfunktion zu streichen. In diesem Kapitel werden wir dieses Manko beheben, indem wir eine Echtzeit-Streaming-Pipeline für maschinelles Lernen implementieren, die Cloud Dataflow und Vertex AI nutzt.
Alle Codeschnipsel in diesem Kapitel sind im Ordner 11_realtime des GitHub-Repositorys verfügbar. In der Datei README.md in diesem Verzeichnis findest du Anweisungen, wie du die in diesem Kapitel beschriebenen Schritte ausführst.
Zeitliche Durchschnittswerte
Welche Zeitfenster-Aggregate-Funktionen wollten wir nutzen, konnten es aber nicht? Die Ankunftszeiten der Flüge werden auf der Grundlage der durchschnittlichen Taxi-Out-Zeit am Abflughafen zu dieser bestimmten Stunde geplant. Das maschinelle Lernmodell kann diesen Durchschnitt ganz einfach erlernen, weil wir den gesamten Datensatz anzeigen und dem ML-Modell den Namen des Abflughafens ...
Get Data Science auf der Google Cloud Platform, 2. now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.