Teil II. Fortgeschrittenes Scraping
Du hast die Grundlagen für das Web Scrapen gelegt, jetzt kommt der spaßige Teil. Bis zu diesem Punkt waren deine Web Scraper relativ dumm. Sie sind nicht in der Lage, Informationen abzurufen, wenn sie ihnen nicht sofort in einem schönen Format vom Server präsentiert werden. Sie nehmen alle Informationen für bare Münze und speichern sie ohne jede Analyse. Formulare, Website-Interaktionen und sogar JavaScript machen ihnen einen Strich durch die Rechnung. Kurz gesagt, sie sind nicht in der Lage, Informationen abzurufen, es sei denn, diese Informationen wollen wirklich abgerufen werden.
Dieser Teil des Buches hilft dir, Rohdaten zu analysieren, um die Geschichte hinter den Daten zu verstehen - die Geschichte, die Websites oft unter Schichten von JavaScript, Anmeldeformularen und Anti-Scraping-Maßnahmen verbergen. Du lernst, wie du Web Scraper einsetzen kannst, um deine Websites zu testen, Prozesse zu automatisieren und in großem Maßstab auf das Internet zuzugreifen. Am Ende dieses Abschnitts wirst du über die Werkzeuge verfügen, mit denen du fast jede Art von Daten in jeder Form und in jedem Teil des Internets sammeln und manipulieren kannst.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access