Capítulo 6. Evaluación de la calidad de los datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los dos últimos capítulos, hemos centrado nuestros esfuerzos en identificar y acceder a distintos formatos de datos en diferentes ubicaciones, desde hojas de cálculo a sitios web. Pero conseguir datos (potencialmente) interesantes es sólo el principio. El siguiente paso es realizar una evaluación exhaustiva de la calidad para saber si lo que tenemos es útil, rescatable o simplemente basura.

Como habrás deducido de la lectura del Capítulo 3, la elaboración de datos de calidad es una empresa compleja y que requiere mucho tiempo. El proceso es a partes iguales investigación, experimentación y perseverancia tenaz. Y lo que es más importante, comprometerte con la calidad de los datos significa que tienes que estar dispuesto a invertir cantidades significativas de tiempo y energía, y a tirarlo todo por la borda y empezar de nuevo si, a pesar de tus esfuerzos, los datos que tienes no pueden estar a la altura.

A la hora de la verdad, este último criterio es probablemente lo que hace realmente difícil realizar un trabajo de alta calidad y significativo con los datos. Las habilidades técnicas, como espero que ya estés descubriendo, requieren cierto esfuerzo para dominarlas, pero son muy fáciles de conseguir con la práctica suficiente. Las habilidades de investigación son un poco más difíciles de documentar y transmitir, ...

Get Tramitación práctica de datos y calidad de datos en Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.