Chapitre 4. Utilisation de DuckDB avec Polars
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
La plupart des data scientists et des analystes de données connaissent la bibliothèque pandas. Avec pandas, tu peux organiser ton ensemble de données dans des structures Series ou DataFrame et utiliser la gamme variée de fonctions fournies par la bibliothèque pandas pour la manipulation des données. Cependant, l'une des principales plaintes concernant pandas est sa lenteur et son inefficacité lorsqu'il s'agit de traiter de grands ensembles de données. En effet, pandas a été conçu à l'origine pour travailler avec des données tabulaires qui tiennent dans la mémoire. Lorsqu'il traite de grands ensembles de données, il devient lent parce qu'il doit échanger des données dans et hors de la mémoire.
Pour remédier à l'inefficacité de pandas dans le traitement des grands ensembles de données, il existe une bibliothèque concurrente, Polars. La première partie de ce chapitre présente Polars et explique comment tu peux travailler avec (tout comme avec pandas). La deuxième partie de ce chapitre montre comment tu peux interroger les DataFrames Polars à l'aide de DuckDB.
Introduction aux polars
Polars est une bibliothèque DataFrame entièrement écrite en Rust. Polars est conçu avec les éléments suivants à l'esprit :
- La vitesse
Polars s'appuie sur Rust, un langage de programmation système connu pour ses performances. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access