Capítulo 6. Solucionar los problemas de calidad de los datos a escala
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Imagínate esto: es viernes a las 5 de la tarde y estás a punto de desconectarte por hoy. Empiezas a cerrar tus pestañas, a hacer la maleta y a acomodarte en tu estado de ánimo de fin de semana. Justo cuando estás a punto de apagar el portátil, recibes un mensaje urgente de Slack de tu director financiero sobre un cuadro de mandos roto.
"Las cifras están mal en nuestro informe trimestral de resultados", te dice. "¡Yo no firmé esto!"
Suponiendo que el problema tenga que ver con los datos en sí y no con las deficientes finanzas de tu empresa, tienes entre manos un grave caso de inactividad de datos. Abres frenéticamente Looker y descubres que ella tiene razón: el informe no parece correcto y no tienes ni idea de por qué. Ayer validaste los números con ella. Sus tablas y gráficos brillaban absolutamente por su precisión.
Sacas los datos de origen (una hoja de cálculo de Excel que vive en tu escritorio, "Informe financiero V. 212 BUENO_ME_PROMETE_SÍ_BUENO"), pero eso te confunde aún más. Docenas de correos electrónicos, dos llamadas telefónicas, unas cuantas reuniones de Zoom y siete horas después, has determinado el culpable del cuadro de mando errante: un cambio de esquema aguas arriba con una tabla de origen.
Genial, ya has averiguado lo que ha pasado, ¿y ahora qué?
Para la mayoría de los equipos ...
Get Fundamentos de la calidad de datos now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.