Rozdział 5. Generowanie danych w systemach źródłowych

Witamy w rozdziale poświęconym pierwszemu etapowi cyklu życia inżynierii danych: generowaniu danych w systemach źródłowych. Jak opisaliśmy wcześniej, zadaniem inżyniera danych jest pobieranie danych z systemów źródłowych, przetworzenie ich w jakiś sposób i udostępnianie do wykorzystania w przypadkach użycia w dolnej części strumienia przetwarzania. Zanim jednak uzyskasz nieprzetworzone dane, musisz zdać sobie sprawę, gdzie dane istnieją, jak są generowane, jakie mają cechy i jakie osobliwości ich dotyczą.

W tym rozdziale omówiono niektóre popularne wzorce systemów źródeł operacyjnych oraz istotne typy systemów źródłowych. Istnieje wiele systemów źródłowych do generowania danych. Nie wszystkie ...

Get Inżynieria danych w praktyce now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.