Capítulo 2. Importar datos a DuckDB
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 1, viste cómo puedes crear una base de datos DuckDB sencilla y cargar tablas en ella. En el mundo real, tus datos suelen proceder de distintas fuentes de datos y formatos de archivo, como CSV, Excel, Parquet o servidores de bases de datos. En este capítulo, aprenderás primero las distintas formas de crear tus bases de datos DuckDB, y después aprenderás a cargarlas utilizando diversas fuentes de datos. Al final de este capítulo, tendrás una idea clara de cómo trabajar con cada fuente de datos, así como consejos y trucos para tratar con ellas.
Crear bases de datos DuckDB
En esta sección, nos sumergiremos en las diferentes formas en que puedes crear bases de datos DuckDB y te ofreceremos sugerencias sobre qué métodos pueden adaptarse a tus propósitos.
La forma más sencilla de crear una base de datos DuckDB es utilizar la función connect() del módulo duckdb:
importduckdbconn=duckdb.connect()
La función connect() devuelve un objeto DuckDBPyConnection. Por defecto, esta sentencia abre una base de datos en memoria modificable, como se ve aquí:
conn=duckdb.connect(':memory:')
Si deseas crear una base de datos DuckDB que persista en el almacenamiento, establece el argumento database con el nombre de una base de datos, por ejemplo, mydb.duckdb (puedes utilizar cualquier extensión que desees para el nombre de archivo): ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access