Capítulo 7. Pandas, Dask y Polares
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Muchos proyectos científicos y de ciencia de datos utilizan datos en forma de tabla que se ajustan a un marco de datos. Un marco de datos suele recoger una colección heterogénea (es decir, mixta) de tipos de datos, asignados a columnas. Cada entrada del marco de datos es una fila; generalmente se parecen a una hoja de cálculo que podrías ver en Excel.
Pandas se publicó en 2008 y rápidamente se convirtió en la principal biblioteca de marcos de datos del ecosistema Python. A medida que evolucionaba, se discutieron muchas deficiencias, como se documentó más tarde en la infame entrada del blog de Wes McKinney de 2017 "Apache Arrow y las '10 cosas que odio de pandas'". En el momento de escribir esto, ocho años después de esa entrada de blog, Pandas sigue siendo la biblioteca de marcos de datos de Python más popular. En las siguientes ...