Capítulo 3. Comprender la calidad de los datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Los datos están por todas partes. Los generan automáticamente nuestros dispositivos móviles, nuestras actividades de compra y nuestros movimientos físicos. Los captan los contadores eléctricos, los sistemas de transporte público y la infraestructura de comunicaciones. Y se utilizan para estimar los resultados de nuestra salud, nuestro potencial de ingresos y nuestra solvencia.1 Los economistas han llegado a declarar que los datos son el "nuevo petróleo".2 dado su potencial para transformar tantos aspectos de la vida humana.

Aunque los datos pueden ser abundantes, la verdad es que los buenos datos son escasos. La pretensión de "la revolución de los datos" es que, con datos suficientes, podemos comprender mejor el presente y mejorar -o incluso predecir- el futuro. Sin embargo, para que todo esto sea posible, los datos subyacentes deben ser de alta calidad. Sin datos de buena calidad, todos nuestros esfuerzos por reunirlos, analizarlos, visualizarlos y comunicarlos no nos aportarán, en el mejor de los casos, más conocimientos sobre el mundo que cuando empezamos. Aunque eso sería una desafortunada pérdida de esfuerzo, las consecuencias de no reconocer que tenemos datos de mala calidad son aún peores, porque pueden llevarnos a desarrollar una visión aparentemente racional pero peligrosamente distorsionada de la realidad. ...

Get Tramitación práctica de datos y calidad de datos en Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.