Capítulo 6. Carga de datos, almacenamiento y formatos de archivo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Leer datos y hacerlos accesibles (lo que a menudo se denomina carga de datos) es un primer paso necesario para utilizar la mayoría de las herramientas de este libro. El términoanálisis sintáctico también se utiliza a veces para describir la carga de datos de texto y su interpretación como tablas y diferentes tipos de datos. Voy a centrarme en la entrada y salida de datos utilizando pandas, aunque hay numerosas herramientas en otras bibliotecas que ayudan a leer y escribir datos en diversos formatos.
La entrada y la salida suelen dividirse en unas pocas categorías principales: lectura de archivos de texto y otros formatos más eficientes en disco, carga de datos de bases de datos e interacción con fuentes de red como las API web.
6.1 Leer y escribir datos en formato texto
pandas dispone de varias funciones para leer datos tabulares como un objeto DataFrame. La Tabla 6-1 resume algunas de ellas; pandas.read_csv es una de las más utilizadas en este libro. Veremos los formatos de datos binarios más adelante, en la Sección 6.2, "Formatos de datos binarios".
| Función | Descripción |
|---|---|
read_csv | Carga datos delimitados de un archivo, URL u objeto similar a un archivo; utiliza la coma como delimitador por defecto |
read_fwf | Leer datos en formato de columna de ... |