KAPITEL 24

Web-Scraping

Einführung

Dieses Kapitel führt Sie in die Grundlagen des Web-Scrapings mit rvest ein. Web-Scraping (übersetzt etwa »im Web schürfen«) ist ein nützliches Tool, um Daten aus Webseiten zu extrahieren. Manche Websites bieten eine API, eine Reihe von strukturierten HTTP-Anfragen, die Daten als JSON zurückgeben. Diese Ergebnisse können Sie dann mit den Techniken aus Kapitel 23 weiterverarbeiten. Wo immer es möglich ist, sollten Sie die API1 verwenden, da sie in der Regel zuverlässigere Daten liefert. Die Programmierung mit Web-APIs ginge allerdings über den Rahmen dieses Buchs hinaus. Stattdessen befassen wir uns mit Scraping, einer Technik, die unabhängig davon funktioniert, ob eine Site eine API bereitstellt oder nicht.

Get R für Data Science, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.