Rozdział 4. Modele ekstrakcji danych

Pisanie schludnego i skalowalnego kodu jest skomplikowane nawet wtedy, gdy masz kontrolę nad danymi i sposobami ich wprowadzania. Tworzenie kodu robotów indeksujących, których zadaniem jest pobieranie i przechowywanie różnorodnych typów danych pochodzących z różnych witryn internetowych, nad którymi programista zupełnie nie sprawuje kontroli, wiąże się niejednokrotnie ze specyficznymi wyzwaniami organizacyjnymi.

Być może będziesz mieć za zadanie zebrać najnowsze wiadomości lub wpisy blogowe z różnych witryn, z których każda cechuje się odrębną szatą graficzną i korzysta z innych szablonów. W jednej witrynie nagłówek h1 może zawierać tytuł artykułu, w innej — tytuł samej witryny, tytuł artykułu zaś może być ...

Get Ekstrakcja danych z językiem Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.