Kapitel 2. Extrahieren von textuellen Einblicken mit APIs

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Wenn du den Ansatz für eine Forschungsfrage festlegen oder mit der Arbeit an einem Textanalyseprojekt beginnen willst, ist die Verfügbarkeit von Daten oft der erste Stolperstein. Eine einfache Google-Suche oder die spezifischere Dataset-Suche führt zu kuratierten Datensätzen, von denen wir einige in den folgenden Kapiteln dieses Buches verwenden werden. Je nach deinem Projekt können sich solche Datensätze als allgemein und für deinen Anwendungsfall als ungeeignet erweisen. Möglicherweise musst du deinen eigenen Datensatz erstellen, und die Programmierschnittstellen (APIs) von sind eine Möglichkeit, Daten programmatisch und automatisch zu extrahieren.

Was du lernen wirst und was wir bauen werden

In diesem Kapitel geben wir dir einen Überblick über APIs und stellen dir Blueprints vor, mit denen du Daten für dein Projekt von beliebten Websites wie GitHub und Twitter extrahieren kannst. Du lernst, wie du Authentifizierungs-Tokens verwendest, mit Paginierung umgehst, Ratenlimits verstehst und die Datenextraktion automatisierst. Am Ende dieses Kapitels wirst du in der Lage sein, deine eigenen Datensätze zu erstellen, indem du API-Aufrufe an jeden identifizierten Dienst machst. Die Blueprints werden zwar mit konkreten Beispielen wie GitHub und Twitter illustriert, können aber für jede API verwendet ...

Get Blaupausen für Textanalyse mit Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.