Capítulo 10. Agregación de datos y operaciones de grupo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Categorizar un conjunto de datos y aplicar una función a cada grupo, ya sea una agregación o transformación de, puede ser un componente crítico de un flujo de trabajo de análisis de datos. Después de cargar, fusionar y preparar un conjunto de datos, puede que necesites calcular estadísticas de grupo o, posiblemente, tablas pivotantes con fines informativos o de visualización. pandas proporciona una interfaz groupby versátil, que te permite cortar, dividir y resumir conjuntos de datos de forma natural.
Una de las razones de la popularidad de las bases de datos relacionales y de SQL (que significa "lenguaje de consulta estructurado") es la facilidad con la que se pueden unir, filtrar, transformar y agregar datos. Sin embargo, los lenguajes de consulta como SQL imponen ciertas limitaciones al tipo de operaciones de grupo que pueden realizarse. Como verás, con la expresividad de Python y pandas, podemos realizar operaciones de grupo bastante complejas expresándolas como funciones personalizadas de Python que manipulan los datos asociados a cada grupo. En este capítulo aprenderás a:
Divide un objeto pandas en trozos utilizando una o más claves (en forma de funciones, matrices o nombres de columnas de DataFrame)
Calcula estadísticas de resumen de grupo, como recuento, media o desviación típica, o una función definida ...