Fazit

In Kapitel 1 haben wir über die Ziele der Datenanalyse gesprochen und darüber, wie man mit statistischen und maschinellen Lernmodellen datengesteuerte Beratung anbieten kann. Außerdem haben wir unser Fallstudienproblem formuliert - die Empfehlung, ob ein Reisender ein geplantes Treffen absagen sollte, basierend auf der Wahrscheinlichkeit, dass der Flug, den er nimmt, Verspätung hat.

In Kapitel 2 haben wir die Aufnahme von Flugdaten von der Website des Bureau of Transportation Statistics automatisiert. Zunächst haben wir ein Webformular zurückentwickelt, Python-Skripte geschrieben, um die erforderlichen Daten herunterzuladen, und die Daten auf Google Cloud Storage gespeichert. Schließlich haben wir den Ingest-Prozess serverlos gemacht, indem wir eine Cloud Run-Anwendung erstellt haben, die den Ingest ausführt und vom Zeitplannungsprogramm aus aufgerufen werden kann.

In Kapitel 3 haben wir erörtert, warum es wichtig ist, die Erkenntnisse der Endnutzer so früh wie möglich in unsere Datenmodellierung einzubeziehen. Dies haben wir erreicht, indem wir ein Dashboard in Data Studio erstellt und dieses Dashboard mit Cloud SQL gefüllt haben. Das Dashboard diente dazu, ein einfaches Kontingenztabellenmodell zu erläutern, das die Wahrscheinlichkeit einer pünktlichen Ankunft anhand einer Schwelle für die Abflugverspätung des Fluges vorhersagte.

In Kapitel 4 simulierten wir die Flugdaten so, als ob sie in Echtzeit eintreffen würden, nutzten die Simulation, um Nachrichten in Cloud Pub/Sub ...

Get Data Science auf der Google Cloud Platform, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.