Rozdział 3. Najczęściej spotykane wzorce potoków danych
Nawet dla doświadczonego inżyniera danych projektowanie nowego potoku danych za każdym razem będzie nie lada wyzwaniem. Jak już wyjaśniłem w rozdziale 2., poszczególne źródła danych i infrastruktura wiążą się zarówno z wyzwaniami, jak i możliwościami. Ponadto potoki danych są budowane w różnych celach oraz z uwzględnieniem różnych ograniczeń. Czy dane muszą być przetwarzane niemalże w czasie rzeczywistym? Czy mogą być uaktualniane raz dziennie? Czy będą modelowane do użycia w panelach, czy może jako dane wejściowe dla modeli uczenia maszynowego (ang. machine learning, ML)?
Na szczęście w potokach danych istnieją pewne najczęściej spotykane wzorce, które okazały się skuteczne i możliwe do ...
Get Potoki danych now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.