Capitolo 3. Progettare una buona architettura dei dati
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Una buona architettura dei dati fornisce funzionalità senza soluzione di continuità in ogni fase del ciclo di vita dei dati e del sottociclo. Inizieremo definendo l'architettura dei dati e poi discuteremo dei componenti e delle considerazioni da fare. In seguito tratteremo di modelli specifici di batch (data warehouse, data lake), modelli di streaming e modelli che uniscono batch e streaming. Inoltre, sottolineeremo l'importanza di sfruttare le capacità del cloud per offrire scalabilità, disponibilità e affidabilità.
Cos'è l'architettura dei dati?
Il successo dell'ingegneria dei dati di si basa su un'architettura dei dati solida come una roccia. Questo capitolo si propone di passare in rassegna alcuni approcci e framework di architettura molto diffusi, per poi elaborare la nostra definizione di ciò che rende una "buona" architettura dei dati. In effetti, non riusciremo a rendere tutti felici. Tuttavia, forniremo una definizione pragmatica e specifica per il dominio aziendale dell'architettura dei dati che riteniamo possa funzionare per aziende di dimensioni, processi aziendali ed esigenze molto diverse.
Che cos'è l'architettura dei dati? Quando ci si sofferma a capire cosa sia, l'argomento diventa un po' oscuro; la ricerca sull'architettura dei dati porta a molte definizioni incoerenti ...