Rozdział 5. Scrapy
W poprzednim rozdziale zaprezentowałam pewne techniki i wzorce tworzenia dużych, skalowalnych i (co najważniejsze!) łatwych w utrzymaniu robotów indeksujących. Nie jest to skomplikowany proces, jeżeli zamierzasz przeprowadzać go własnoręcznie, ale istnieje wiele bibliotek, platform programistycznych (ang. frameworks), a nawet narzędzi z interfejsem graficznym, które mogą realizować go za Ciebie, a przynajmniej ułatwić Ci nieco życie.
Niniejszy rozdział poświęciłam opisowi jednej z najlepszych platform do tworzenia pełzaczy: Scrapy. Gdy pisałam pierwsze wydanie książki, platforma Scrapy nie była jeszcze dostępna w środowisku Python 3.x i jej opis ograniczał się do jednego podrozdziału. Od tamtego czasu biblioteka otrzymała ...
Get Ekstrakcja danych z językiem Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.