Capítulo 6. Carga de datos, almacenamiento y formatos de archivo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Leer datos y hacerlos accesibles (lo que a menudo se denomina carga de datos) es un primer paso necesario para utilizar la mayoría de las herramientas de este libro. El términoanálisis sintáctico también se utiliza a veces para describir la carga de datos de texto y su interpretación como tablas y diferentes tipos de datos. Voy a centrarme en la entrada y salida de datos utilizando pandas, aunque hay numerosas herramientas en otras bibliotecas que ayudan a leer y escribir datos en diversos formatos.

La entrada y la salida suelen dividirse en unas pocas categorías principales: lectura de archivos de texto y otros formatos más eficientes en disco, carga de datos de bases de datos e interacción con fuentes de red como las API web.

6.1 Leer y escribir datos en formato texto

pandas dispone de varias funciones para leer datos tabulares como un objeto DataFrame. La Tabla 6-1 resume algunas de ellas; pandas.read_csv es una de las más utilizadas en este libro. Veremos los formatos de datos binarios más adelante, en la Sección 6.2, "Formatos de datos binarios".

Tabla 6-1. Funciones de carga de datos de texto y binarios en pandas
FunciónDescripción
read_csvCarga datos delimitados de un archivo, URL u objeto similar a un archivo; utiliza la coma como delimitador por defecto
read_fwfLeer datos en formato de columna de ...

Get Python para el Análisis de Datos, 3ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.