Capítulo 9. Introducción al análisis de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hasta ahora, este libro se ha centrado principalmente en la logística de adquisición, evaluación, transformación y aumento de datos. Hemos explorado cómo escribir código que pueda recuperar datos de Internet, extraerlos de formatos poco amigables, evaluar su integridad y tener en cuenta las incoherencias. Incluso hemos pasado algún tiempo pensando en cómo asegurarnos de que las herramientas que utilizamos para hacer todo esto -nuestros scripts de Python- están optimizadas para satisfacer nuestras necesidades, tanto ahora como en el futuro.
Llegados a este punto, sin embargo, es hora de revisar el porqué de todo este trabajo. En "¿Qué es la "gestión de datos"?", describí el propósito de la gestión de datos como la transformación de datos "en bruto" en algo que pueda utilizarse para generar conocimiento y significado. Pero a menos que realicemos al menos un cierto grado de análisis, no hay forma de saber si nuestros esfuerzos de manipulación han sido suficientes, o qué ideas pueden producir. En ese sentido, detener nuestro trabajo de búsqueda de datos en la fase de aumento/transformación sería como preparar tu mise en place y luego salir de la cocina. No pasas horas preparando cuidadosamente las verduras y midiendo los ingredientes a menos que quieras cocinar. Y eso es el análisis de datos: tomar todos esos datos tan bien ...
Get Tramitación práctica de datos y calidad de datos en Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.