Overview
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Wenn Programmieren Magie ist, dann ist Web Scraping sicherlich eine Form der Zauberei. Wenn du ein einfaches, automatisiertes Programm schreibst, kannst du Webserver abfragen, Daten anfordern und sie analysieren, um die benötigten Informationen zu extrahieren. Die erweiterte Ausgabe dieses praktischen Buches führt dich nicht nur in das Web Scraping ein, sondern dient auch als umfassender Leitfaden für das Scraping fast aller Arten von Daten aus dem modernen Web.
Teil I konzentriert sich auf die Mechanismen des Web Scraping: die Verwendung von Python, um Informationen von einem Webserver anzufordern, die grundlegende Verarbeitung der Serverantwort und die automatische Interaktion mit Websites. Teil II beschäftigt sich mit einer Reihe spezifischerer Tools und Anwendungen, die für jedes Web-Scraping-Szenario geeignet sind, das dir begegnen könnte.
- Parsen komplizierter HTML-Seiten
- Crawler mit dem Scrapy-Framework entwickeln
- Methoden zum Speichern von gescrapten Daten lernen
- Lesen und Extrahieren von Daten aus Dokumenten
- Bereinigen und Normalisieren von schlecht formatierten Daten
- Natürliche Sprachen lesen und schreiben
- Formulare und Logins durchforsten
- Scrapen von JavaScript und Crawlen durch APIs
- Bild-zu-Text-Software verwenden und schreiben
- Vermeide Scraping-Fallen und Bot-Blocker
- Verwende Scraper, um deine Website zu testen
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access