Rozdział 7. Pozyskiwanie danych

We wcześniejszych rozdziałach zapoznałeś się z różnymi systemami źródłowymi, z którymi spotkasz się w pracy inżyniera danych, oraz ze sposobami składowania danych. W tym rozdziale zwrócimy uwagę na wzorce i wybory, które mają zastosowanie do pozyskiwania danych z różnych systemów źródłowych. Omówimy składowe pozyskiwania danych (patrz rysunek 7.1), kluczowe zagadnienia inżynieryjne dotyczące fazy pozyskiwania, główne wzorce pozyskiwania partiami i pozyskiwania strumieniowego, technologie, z którymi się spotkasz, osoby, z którymi będziesz pracować podczas opracowywania potoku pozyskiwania danych, oraz nurty inżynierii danych w kontekście fazy pozyskiwania.

Rysunek 7.1. Aby rozpocząć przetwarzanie danych, trzeba ...

Get Inżynieria danych w praktyce now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.