Overview
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Le pipeline di dati sono fondamentali per avere successo nell'analisi dei dati. Spostare i dati da un sacco di fonti diverse e trasformarli per dare un senso è la differenza tra avere i dati e usarli davvero. Questa guida tascabile spiega cosa sono le pipeline di dati e come funzionano nel mondo dei dati di oggi.
Imparerai le considerazioni comuni e i punti chiave da tenere a mente quando si implementano le pipeline, come l'acquisizione dei dati in batch o in streaming e la scelta tra costruire o acquistare. Questo libro affronta le decisioni più comuni prese dai professionisti dei dati e discute i concetti fondamentali che si applicano ai framework open source, ai prodotti commerciali e alle soluzioni sviluppate internamente.
Imparerai:
- Cos'è una pipeline di dati e come funziona
- Come vengono spostati ed elaborati i dati nelle moderne infrastrutture di dati, comprese le piattaforme cloud
- Gli strumenti e i prodotti più usati dai data engineer per costruire pipeline
- Come le pipeline supportano le esigenze di analisi e reporting
- Cosa tenere a mente per la manutenzione, il test e gli avvisi delle pipeline