Capítulo 6. Resolver problemas de qualidade de dados à escala
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Imagina o seguinte: é sexta-feira às 17 horas e estás prestes a terminar a sessão do dia. Começas a fechar os teus separadores, a arrumar a tua mala e a entrar no teu estado de espírito de fim de semana. Quando estás prestes a desligar o portátil, recebes uma mensagem urgente no Slack do teu CFO sobre um painel de instrumentos avariado.
"Os números estão errados no nosso relatório de resultados trimestrais", diz-te ela. "Não fui eu que assinei isto!"
Partindo do princípio de que o problema tem a ver com os dados em si e não com a má qualidade das finanças da empresa, tens um caso grave de inatividade de dados em mãos. Abres freneticamente o Looker e descobres que ela tem razão - o relatório parece estar muito errado e não fazes ideia porquê. Ontem, validaste os números com ela. As tuas tabelas e gráficos estavam absolutamente brilhantes de precisão.
Puxa os dados de origem (uma folha de cálculo do Excel que se encontra no seu ambiente de trabalho, "Relatório Financeiro V. 212 BOM_EU_ PROMETO_SIM_ BOM"), mas isso confunde-o ainda mais. Dezenas de e-mails, dois telefonemas, algumas reuniões no Zoom e sete horas depois, determinaste o culpado do dashboard errante: uma alteração de esquema a montante com uma tabela de origem.
Ótimo, já descobriste o que aconteceu - e agora?
Para a maioria das equipas de ...