8 Mit HTML arbeiten

Web-Scraping

image

In einer perfekten Welt wären alle benötigten Daten leicht zugänglich. Das ist aber nur selten der Fall. So werden Daten beispielsweise im Web veröffentlicht. In HTML eingebettete Daten müssen von Webbrowsern gerendert und von Menschen gelesen werden können. Was aber, wenn Sie diese Daten mit Code verarbeiten müssen? Geht das überhaupt? Glücklicherweise ist Python so etwas wie ein Champion, wenn es um das maschinelle Auslesen – das sogenannte Scraping – von Daten aus Webseiten geht, und in diesem Kapitel werden wir Ihnen zeigen, wie das funktioniert. Sie werden außerdem lernen, wie die ausgelesenen HTML-Seiten ...

Get Python von Kopf bis Fuß, 3rd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.