February 2019
Intermediate to advanced
272 pages
8h 26m
Polish
Ekstrakcja danych jest szybkim procesem. Zazwyczaj jest znacznie szybsza od tuzina wynajętych stażystów własnoręcznie kopiujących dane z internetu. Oczywiście rozwój technologii wraz z naszym młynem hedonistycznym sprawiają, że w pewnym momencie nawet obecne możliwości nie zapewniają dostatecznej szybkości. To właśnie w takich sytuacjach ludzie kierują swoją uwagę na obliczenia rozproszone.
W przeciwieństwie do większości innych działów technologicznych ekstrakcji danych nie możemy usprawnić wyłącznie poprzez „dodanie większej liczby cykli”. Jeden proces jest szybki, dołączenie drugiego niekoniecznie podwaja tę szybkość. Wprowadzenie trzech procesów może skończyć się banem za dławienie serwera ...