R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Partie IV. L'importation
Dans cette partie du livre, tu apprendras à importer un plus grand nombre de données dans R, ainsi qu'à les mettre sous une forme utile pour l'analyse. Parfois, il suffit d'appeler une fonction du logiciel d'importation de données approprié. Mais dans des cas plus complexes, cela peut nécessiter à la fois du Tidy et de la transformation pour arriver au rectangle bien rangé avec lequel tu préfères travailler.
Figure IV-1. L'importation de données est le début du processus de science des données ; sans données, tu ne peux pas faire de science des données !
Dans cette partie du livre, tu apprendras à accéder aux données stockées de la manière suivante :
Au chapitre 20, tu apprendras à importer des données à partir de feuilles de calcul Excel et de Google Sheets.
Au chapitre 21, tu apprendras à extraire des données d'une base de données et à les introduire dans R (et tu apprendras aussi un peu comment extraire des données de R et les introduire dans une base de données).
Au chapitre 22, tu découvriras Arrow, un outil puissant pour travailler avec des données hors mémoire, en particulier lorsqu'elles sont stockées au format parquet.
Au chapitre 23, tu apprendras à travailler avec des données hiérarchiques, y compris les listes profondément imbriquées produites par les données stockées au format JSON.
Dans le chapitre 24, tu apprendras le "scraping" web, l'art ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access