Capítulo 6. Carga de datos, almacenamiento y formatos de archivo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Leer datos y hacerlos accesibles (lo que a menudo se denomina carga de datos) es un primer paso necesario para utilizar la mayoría de las herramientas de este libro. El términoanálisis sintáctico también se utiliza a veces para describir la carga de datos de texto y su interpretación como tablas y diferentes tipos de datos. Voy a centrarme en la entrada y salida de datos utilizando pandas, aunque hay numerosas herramientas en otras bibliotecas que ayudan a leer y escribir datos en diversos formatos.
La entrada y la salida suelen dividirse en unas pocas categorías principales: lectura de archivos de texto y otros formatos más eficientes en disco, carga de datos de bases de datos e interacción con fuentes de red como las API web.
6.1 Leer y escribir datos en formato texto
pandas dispone de varias funciones para leer datos tabulares como un objeto DataFrame. La Tabla 6-1 resume algunas de ellas; pandas.read_csv
es una de las más utilizadas en este libro. Veremos los formatos de datos binarios más adelante, en la Sección 6.2, "Formatos de datos binarios".
Función | Descripción |
---|---|
read_csv | Carga datos delimitados de un archivo, URL u objeto similar a un archivo; utiliza la coma como delimitador por defecto |
read_fwf | Leer datos en formato de columna de ... |
Get Python para el Análisis de Datos, 3ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.