R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 23. Données hiérarchiques
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
Dans ce chapitre, tu apprendras l'art de la rectangulation des données, en prenant des données fondamentalement hiérarchiques, ou arborescentes, et en les convertissant en un cadre de données rectangulaire composé de lignes et de colonnes. C'est important parce que les données hiérarchiques sont étonnamment courantes, en particulier lorsqu'on travaille avec des données provenant du Web.
Pour apprendre à faire des rectangles, tu devras d'abord te familiariser avec les listes, la structure de données qui rend possible les données hiérarchiques. Ensuite, tu apprendras à connaître deux fonctions cruciales de tidyr : tidyr::unnest_longer() et tidyr::unnest_wider(). Nous te montrerons ensuite quelques études de cas, en appliquant ces fonctions simples encore et encore pour résoudre des problèmes réels. Nous terminerons en parlant de JSON, la source la plus fréquente d'ensembles de données hiérarchiques et un format commun pour l'échange de données sur le Web.
Conditions préalables
Dans ce chapitre, nous utiliserons de nombreuses fonctions de tidyr, un membre essentiel du tidyverse. Nous utiliserons également repurrrsive pour fournir quelques ensembles de données intéressants pour la pratique du rectangle, et nous terminerons par l'utilisation de jsonlite pour lire des fichiers JSON dans des listes R.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access