Skip to Content
Python para el Análisis de Datos, 3ª Edición
book

Python para el Análisis de Datos, 3ª Edición

by Wes McKinney
September 2024
Intermediate to advanced
582 pages
13h 43m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Python para el Análisis de Datos, 3ª Edición

Capítulo 7. Limpieza y preparación de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Durante la realización de análisis y modelización de datos, se dedica una cantidad significativa de tiempo a la preparación de los datos: carga, limpieza, transformación y reordenación. A menudo se dice que estas tareas ocupan el 80% o más del tiempo de un analista. A veces, la forma en que se almacenan los datos en archivos o bases de datos no tiene el formato adecuado para una tarea concreta. Muchos investigadores optan por hacer un procesamiento ad hoc de los datos de una forma a otra utilizando un lenguaje de programación de propósito general, como Python, Perl, R o Java, o herramientas de procesamiento de texto de Unix como sed o awk. Afortunadamente, pandas, junto con las características incorporadas del lenguaje Python, te proporciona un conjunto de herramientas de alto nivel, flexibles y rápidas, que te permitirán manipular los datos para darles la forma adecuada.

Si identificas un tipo de manipulación de datos que no aparece en este libro ni en ninguna otra parte de la biblioteca pandas, no dudes en compartir tu caso de uso en una de las listas de correo de Python o en el sitio GitHub de pandas. De hecho, gran parte del diseño y la implementación de pandas han sido impulsados por las necesidades de las aplicaciones del mundo real.

En este capítulo hablo de herramientas para datos que faltan, datos duplicados, manipulación ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Python para el Análisis de Datos Geoespaciales

Python para el Análisis de Datos Geoespaciales

Bonny P. McClain
Planos para el análisis de textos con Python

Planos para el análisis de textos con Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler
Python de alto rendimiento, 2ª edición

Python de alto rendimiento, 2ª edición

Micha Gorelick, Ian Ozsvald

Publisher Resources

ISBN: 9781098181321Supplemental Content