Capítulo 3. Avaliar o impacto comercial da monitorização automatizada da qualidade dos dados
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Automatizando a monitorização da qualidade dos dados com a aprendizagem automática, podes ir além das abordagens tradicionais, como a monitorização de métricas e os testes baseados em regras. Mas antes de entrarmos nos detalhes de implementação desta abordagem, gostaríamos de abordar o que pode ser o elefante na sala (ou, pelo menos, na página). Vale a pena?
Não vamos fingir que existe uma única resposta certa para essa pergunta. Também não vamos dizer a toda a gente para construir ou comprar uma plataforma automatizada de monitorização da qualidade dos dados amanhã. No entanto, o que podemos fazer é ajudar-te a responder a perguntas como:
-
Que tipo de dados é mais adequado para a monitorização automática da qualidade dos dados?
-
Como deve ser a nossa pilha de dados antes de investirmos nisto?
-
Como é que podemos medir o ROI de uma nova abordagem de monitorização da qualidade dos dados?
Os problemas de qualidade dos dados são inevitáveis (ver a barra lateral seguinte) - mas a solução que escolhes não é. No final deste capítulo, deverás ter todas as ferramentas necessárias para efetuar uma autoavaliação do que a tua organização pode ganhar com uma abordagem automatizada. Abordaremos os quatro principais factores a considerar: os teus dados, o teu sector, a tua maturidade ...