Skip to Main Content
Ekstrakcja danych z językiem Python
book

Ekstrakcja danych z językiem Python

by Ryan Mitchell
February 2019
Intermediate to advanced content levelIntermediate to advanced
272 pages
8h 26m
Polish
Helion
Content preview from Ekstrakcja danych z językiem Python

Rozdział 3. Tworzenie robotów indeksujących

Do tej pory zajmowaliśmy pojedynczymi stronami stanowiącymi niejako sztuczne przykłady. W tym rozdziale przejdziemy do rzeczywistych problemów, w których pełzacze będą się poruszać pomiędzy wieloma stronami, a nawet serwisami.

Roboty indeksujące zwane są również robotami internetowymi lub pełzaczami (ang. web crawlers), ponieważ „pełzają” po internecie. Podstawą ich działania jest rekurencyjność. Muszą odczytywać treść strony z adresu URL, sprawdzać tę stronę w poszukiwaniu innych adresów URL i pobierać strony umieszczone za tymi adresami itd.

Uważaj jednak: to, że możesz „pełzać” po internecie, nie zawsze oznacza, że powinieneś to robić. Roboty indeksujące użyte w poprzednich rozdziałach spisują się ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Wysoko wydajny Python

Wysoko wydajny Python

Ian Ozsvald Micha Gorelick
Python. Receptury. Wydanie III

Python. Receptury. Wydanie III

David Beazley, Brian K. Jones
Python. Programuj szybko i wydajnie

Python. Programuj szybko i wydajnie

Micha Gorelick, Ian Ozsvald

Publisher Resources

ISBN: 9781098125295