Capitolo 9. Modelli di progettazione della qualità dei dati
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Fiducia è un valore importante di un set di dati. Lo scambio di dati è come una transazione reciproca, in cui si fornisce o si consuma un servizio (dataset). L'obiettivo finale è che il produttore e il consumatore siano felici di questo scambio di dati. Sfortunatamente, raramente sarai entusiasta di lavorare con un set di dati di cui non ci si può fidare, in quanto le informazioni che ne derivano potrebbero essere sbagliate in qualsiasi momento.
Una delle cause della perdita di fiducia è la scarsa qualità dei dati, ovvero l'incompletezza, l'imprecisione e/o l'incoerenza. Ma la buona notizia è che questi problemi non sono nuovi e, anche se gli ingegneri dei dati continuano a combatterli, esistono alcuni modelli di progettazione per mitigare i problemi di qualità dei dati.
In questo capitolo affronteremo i problemi di qualità dei dati con l'aiuto di modelli di progettazione organizzati in tre diverse categorie. Nella prima categoria vedremo come imporre la qualità ed evitare così di esporre dati di scarsa qualità ai tuoi utenti a valle.
Nella prossima parte vedremo come affrontare i problemi di qualità dei dati a livello di schema. Spesso i tuoi produttori possono generare dati senza problemi apparenti, fino al giorno in cui decidono di modificare lo schema. A seconda del tipo di evoluzione, ...