Capitolo 8. Modelli di progettazione per l'archiviazione dei dati
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Hai mai aspettato i risultati di una query o di un lavoro per più di due minuti mentre lavoravi in un ambiente di big data? Molti di voi probabilmente risponderanno di sì e alcuni potrebbero aver aspettato anche più di 10 minuti. Questo fattore tempo è un aspetto importante nel nostro lavoro di ingegneria dei dati. Più veloce è l'esecuzione di una query o di un lavoro, prima otterremo la risposta e, si spera, meno costerà ottenerla.
Puoi ottimizzare questo fattore tempo in due modi. In primo luogo, puoi aggiungere più risorse di calcolo, un metodo relativamente semplice e veloce che non richiede ulteriori passaggi organizzativi. Tuttavia, si tratta anche di un'operazione retroattiva che potresti dover eseguire sotto pressione, ad esempio dopo che gli utenti iniziano a lamentarsi della latenza di lettura.
Il secondo modo per ottimizzare è quello di intraprendere un'azione preventiva che si basa su un'organizzazione oculata dei dati con i modelli di progettazione dell'archiviazione dei dati trattati in questo capitolo. Questa organizzazione ben studiata dovrebbe migliorare i tempi di esecuzione e fornire un feedback in anticipo.
In questo capitolo scoprirai innanzitutto due strategie di partizionamento che aiutano a ridurre il volume di dati da elaborare e permettono anche di ...