Kapitel 5. Zugang zu webbasierten Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Das Internet ist eine unglaubliche Datenquelle, die wohl der Grund dafür ist, dass Daten ein so dominanter Teil unseres sozialen, wirtschaftlichen, politischen und sogar kreativen Lebens geworden sind. In Kapitel 4 haben wir uns auf den Zugriff auf und die Neuformatierung von dateibasierten Daten konzentriert, die bereits auf unseren Geräten oder in der Cloud gespeichert waren. Gleichzeitig stammten viele dieser Daten ursprünglich aus dem Internet - ob sie nun von einer Website heruntergeladen wurden, wie die Arbeitslosendaten, oder von einer URL abgerufen wurden, wie die Citi Bike-Daten. Nachdem wir nun wissen, wie wir mit Python eine Vielzahl von dateibasierten Datenformaten analysieren und umwandeln können, ist es an der Zeit, sich anzusehen, was es bedeutet, diese Dateien überhaupt zu sammeln - vor allem, wenn es sich bei den Daten um Echtzeitdaten handelt. Zu diesem Zweck werden wir den Großteil dieses Kapitels damit verbringen, zu lernen, wie man an Daten herankommt, die über APIs zur Verfügung gestellt werden - die Anwendungsprogrammierschnittstellen, die ich bereits in Kapitel 4 erwähnt habe. APIs sind der wichtigste (und manchmal auch einzige) Weg, um auf die Daten zuzugreifen, die von Echtzeit- oder On-Demand-Diensten wie Social-Media-Plattformen, Musikstreaming und Suchdiensten erzeugt werden ...

Get Praktisches Python Data Wrangling und Datenqualität now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.