Capítulo 10. Agregación de datos y operaciones de grupo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Categorizar un conjunto de datos y aplicar una función a cada grupo, ya sea una agregación o transformación de, puede ser un componente crítico de un flujo de trabajo de análisis de datos. Después de cargar, fusionar y preparar un conjunto de datos, puede que necesites calcular estadísticas de grupo o, posiblemente, tablas pivotantes con fines informativos o de visualización. pandas proporciona una interfaz groupby versátil, que te permite cortar, dividir y resumir conjuntos de datos de forma natural.

Una de las razones de la popularidad de las bases de datos relacionales y de SQL (que significa "lenguaje de consulta estructurado") es la facilidad con la que se pueden unir, filtrar, transformar y agregar datos. Sin embargo, los lenguajes de consulta como SQL imponen ciertas limitaciones al tipo de operaciones de grupo que pueden realizarse. Como verás, con la expresividad de Python y pandas, podemos realizar operaciones de grupo bastante complejas expresándolas como funciones personalizadas de Python que manipulan los datos asociados a cada grupo. En este capítulo aprenderás a:

  • Divide un objeto pandas en trozos utilizando una o más claves (en forma de funciones, matrices o nombres de columnas de DataFrame)

  • Calcula estadísticas de resumen de grupo, como recuento, media o desviación típica, o una función definida ...

Get Python para el Análisis de Datos, 3ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.