Prólogo
Una pregunta rápida para ti: ¿Cómo puedes distinguir a un científico de datos que realmente ha construido cosas en producción de alguien que sólo ha jugado con los datos? Responde: Se han quemado absolutamente con la calidad de los datos. Cualquiera que realmente haya implementado datos tiene no sólo una cicatriz, sino latigazos en todo el cuerpo por este problema.
He aquí un día típico en la vida de un equipo de ciencia de datos. Un alto ejecutivo ve algo raro en un cuadro de mandos por la mañana, pregunta si la cifra es correcta, y entonces el equipo de datos hace sprints durante las 4 horas siguientes para averiguar la respuesta. Finalmente localizan al ingeniero que olvidó añadir el mecanismo de seguimiento correcto. Pero ya ha pasado el mediodía y el equipo ni siquiera ha llegado a su larga lista de tareas del día. Al salir del modo de extinción de incendios, es difícil avanzar en nada interesante.
Otra forma de decir esto es que siempre dejamos que lo urgente se interponga en el camino de lo importante. Más peligroso es que socavemos la confianza en los datos. Los equipos de ciencia de datos acaban jugando a la defensiva en lugar de al ataque.
He visto esto de primera mano muchas veces. Al principio de la pandemia de COVID-19, me pidieron que ayudara al estado de California a comprender el impacto potencial de la enfermedad. Fue un momento de "manos a la obra", y teníamos acceso a recursos y conjuntos de datos increíbles. Sin embargo, seguíamos cuestionando las ...