Capitolo 5. Generazione di dati nei sistemi sorgente
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Benvenuto nella prima fase del ciclo di vita dell'ingegneria dei dati: la generazione dei dati nei sistemi sorgente. Come abbiamo descritto in precedenza su, il lavoro di un ingegnere dei dati consiste nel prendere i dati dai sistemi di origine, farci qualcosa e renderli utili per i casi d'uso a valle. Ma prima di ottenere i dati grezzi, devi capire dove esistono i dati, come sono stati generati e quali sono le loro caratteristiche e peculiarità.
Questo capitolo tratta alcuni modelli di sistemi sorgente operativi popolari e i principali tipi di sistemi sorgente. Esistono molti sistemi sorgente per la generazione di dati e non li tratteremo tutti in modo esaustivo. Prenderemo in considerazione i dati generati da questi sistemi e gli aspetti da tenere in considerazione quando si lavora con i sistemi sorgente. Discuteremo anche di come le correnti dell'ingegneria dei dati si applicano a questa prima fase del ciclo di vita dell'ingegneria dei dati(Figura 5-1).
Figura 5-1. I sistemi sorgente generano i dati per il resto del ciclo di vita dell'ingegneria dei dati
Con la proliferazione dei dati, in particolare con l'aumento della condivisione dei dati (di cui parleremo più avanti), prevediamo che ...