Chapitre 8. Accès aux données distantes à l'aide de DuckDB
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Jusqu'à présent, dans tous les chapitres précédents, tu as utilisé DuckDB pour travailler avec des données locales, qu'elles se trouvent dans des bases de données MySQL ou dans des fichiers CSV, JSON et Parquet. Dans les scénarios pratiques, les données avec lesquelles tu travailles résident généralement sur des serveurs distants et proviennent fréquemment de plusieurs endroits. Heureusement, DuckDB fournit l'extension httpfs pour te permettre d'accéder aux ensembles de données à distance. De plus, DuckDB permet également d'accéder aux ensembles de données hébergés par Hugging Face, une plateforme où les utilisateurs peuvent partager des modèles pré-entraînés pour l'apprentissage automatique. Hugging Face héberge également un vaste référentiel d'ensembles de données que les développeurs peuvent télécharger pour entraîner leurs propres modèles.
Dans ce chapitre, tu apprendras à utiliser l'extension httpfs de DuckDB pour travailler avec des ensembles de données à distance, ainsi qu'à utiliser DuckDB pour accéder aux vastes ensembles de données hébergés par Hugging Face.
Extension httpfs de DuckDB
L'extension httpfs de DuckDB est une extension autoloadable qui met en œuvre un système de fichiers permettant de lire et d'écrire des fichiers distants. Cette extension permet à DuckDB de lire et d'écrire ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access