Overview
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Wenn Programmierung Magie ist, dann ist Web Scraping sicherlich eine Form der Zauberei. Durch das Schreiben eines einfachen automatisierten Programms können Webserver abgefragt, Daten angefordert und analysiert werden, um die benötigten Informationen zu extrahieren. Diese gründlich aktualisierte dritte Auflage führt nicht nur in das Web Scraping ein, sondern dient auch als umfassender Leitfaden für das Scraping fast aller Arten von Daten aus dem modernen Web.
Teil I konzentriert sich auf die Mechanik des Web Scraping: Verwendung von Python zur Abfrage von Informationen von einem Webserver, grundlegende Handhabung der Serverantwort und automatisierte Interaktion mit Websites. Teil II untersucht eine Vielzahl spezifischerer Tools und Anwendungen, die für jedes Web-Scraping-Szenario geeignet sind, mit dem man wahrscheinlich konfrontiert wird.
- Komplizierte HTML-Seiten analysieren
- Entwickle Crawler mit dem Scrapy-Framework
- Erlerne Methoden zum Speichern der Daten, die du ausliest
- Lies und extrahiere Daten aus Dokumenten
- Bereinige und normalisiere schlecht formatierte Daten
- Lesen und Schreiben natürlicher Sprachen
- Durchforste Formulare und Logins
- JavaScript scrapen und APIs crawlen
- Verwende und schreibe Bild-zu-Text-Software
- Vermeide Scraping-Fallen und Bot-Blocker
- Verwende Scraper, um deine Website zu testen
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access