Skip to Main Content
Erweiterte Analytik mit PySpark
book

Erweiterte Analytik mit PySpark

by Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
September 2024
Intermediate to advanced content levelIntermediate to advanced
236 pages
7h 11m
German
O'Reilly Media, Inc.
Book available
Content preview from Erweiterte Analytik mit PySpark

Kapitel 7. Geografische und zeitliche Datenanalysevon Taxifahrdaten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Geodaten sind Daten, die in irgendeiner Form mit Standortinformationen versehen sind. Solche Daten werden derzeit jeden Tag in großem Umfang von Milliarden von Quellen wie Mobiltelefonen und Sensoren erzeugt. Daten über die Bewegung von Menschen und Maschinen sowie aus der Fernerkundung sind für unsere Wirtschaft und unser allgemeines Wohlbefinden von großer Bedeutung. Die Geodatenanalyse kann uns die Werkzeuge und Methoden an die Hand geben, die wir brauchen, um all diese Daten sinnvoll zu nutzen und sie zur Lösung unserer Probleme einzusetzen.

Die Ökosysteme PySpark und PyData haben sich in den letzten Jahren im Bereich der Geodatenanalyse erheblich weiterentwickelt. Sie werden branchenübergreifend für den Umgang mit ortsbezogenen Daten genutzt und beeinflussen so unser tägliches Leben. Eine alltägliche Aktivität, bei der sich Geodaten auf sichtbare Weise manifestieren, ist der Nahverkehr. Das Phänomen der digitalen Taxidienste, die in den letzten Jahren immer beliebter wurden, hat dazu geführt, dass wir uns der Geodaten stärker bewusst sind. In diesem Kapitel werden wir unsere PySpark- und Datenanalysefähigkeiten in diesem Bereich einsetzen, indem wir mit einem Datensatz arbeiten, der Informationen über Taxifahrten in New York City enthält.

Eine Statistik, die wichtig ist, um ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Aufbau von Pipelines für maschinelles Lernen

Aufbau von Pipelines für maschinelles Lernen

Hannes Hapke, Catherine Nelson
Roboter mit ROS

Roboter mit ROS

Murat Calis
Blaupausen für Textanalyse mit Python

Blaupausen für Textanalyse mit Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler

Publisher Resources

ISBN: 9781098190590Supplemental Content