Prefácio
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Se já passaste por alguma das seguintes situações, levanta a mão (ou podes simplesmente acenar com a cabeça em sinal de solidariedade - não há forma de sabermos o contrário):
Cinco mil linhas numa tabela crítica (e relativamente previsível) transformam-se subitamente em quinhentas, sem qualquer razão.
Um dashboard quebrado faz com que um dashboard executivo cuspa valores nulos.
Uma alteração oculta do esquema quebra um pipeline a jusante.
E a lista continua.
Este livro destina-se a todos os que já sofreram com dados não fiáveis, silenciosamente ou com gritos abafados, e que querem fazer alguma coisa em relação a isso. Esperamos que estes indivíduos venham de engenheiros de dados, analistas de dados ou de ciência de dados, e que estejam ativamente envolvidos na construção, dimensionamento e gestão dos pipelines de dados da sua empresa.
À primeira vista, pode parecer que Data Quality Fundamentals é um manual sobre como limpar, manipular e, em geral, dar sentido aos dados - e é mesmo. Mas, mais do que isso, este livro aborda as melhores práticas, tecnologias e processos para criar sistemas de dados mais fiáveis e, no processo, cultivar a confiança nos dados com a tua equipa e as partes interessadas.
No Capítulo 1, discutiremos por que razão a qualidade dos dados merece atenção agora e como as tendências arquitectónicas e tecnológicas estão a contribuir ...