Rozdział 1. Twój pierwszy robot indeksujący

Gdy zajmiesz się ekstrakcją danych z internetu, zaczniesz doceniać wszelkie niuanse zapewniane przez przeglądarki. Witryny internetowe pozbawione warstwy formatowania HTML, stylów CSS, realizacji kodu JavaScript i wyświetlania grafiki mogą początkowo wyglądać nieco przytłaczająco, ale w tym i następnym rozdziale wyjaśnię, w jaki sposób formatować i interpretować dane bez pomocy przeglądarki.

Rozdział ten rozpoczniemy od podstaw wysyłania do serwera WWW prośby GET (ang. get — otrzymanie; czyli prośby o przesłanie treści strony internetowej) dotyczącej określonej strony, odczytywania kodu HTML tworzącego tę stronę i przeprowadzania prostej ekstrakcji danych w celu odseparowania interesującej nas zawartości. ...

Get Ekstrakcja danych z językiem Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.