Capítulo 8. Introducción a los pandas
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
pandas es un elemento clave en nuestra cadena de herramientas dataviz, ya que lo utilizaremos tanto para limpiar como para explorar nuestro conjunto de datos recién raspado (véase el Capítulo 6). En el último capítulo se presentó NumPy, la biblioteca de procesamiento de matrices de Python que es la base de pandas. Antes de pasar a la aplicación de pandas, este capítulo introducirá sus conceptos clave y mostrará cómo interactúa con los archivos de datos y las tablas de bases de datos existentes. El resto de tu aprendizaje sobre pandas lo harás en el trabajo en los próximos capítulos.
Por qué pandas está hecho a medida para Dataviz
En cualquier visualización de datos, ya sea web o impresa, lo más probable es que los datos visualizados se almacenaran en algún momento en forma de fila-columna en una hoja de cálculo como Excel, un archivo CSV o HDF5. Ciertamente hay visualizaciones, como los gráficos de red, para las que los datos fila-columna no son la mejor forma, pero son la minoría. pandas está hecho a medida para manipular tablas de datos fila-columna con su tipo de datos principal, el DataFrame, que se puede considerar como una hoja de cálculo programática muy rápida.
Por qué se desarrollaron los pandas
Revelado por primera vez por Wes Kinney en 2008, pandas se creó para resolver un problema concreto, a saber, que aunque ...