R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 5. Tidy des données
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
"Les familles heureuses se ressemblent toutes ; chaque famille malheureuse est malheureuse à sa manière." -Léo Tolstoï
"Les ensembles de données Tidy se ressemblent tous, mais chaque ensemble de données désordonné est désordonné à sa manière". -Hadley Wickham
Dans ce chapitre, tu apprendras une façon cohérente d'organiser tes données dans R à l'aide d'un système appelé tidy data. Mettre tes données dans ce format demande un peu de travail au départ, mais ce travail est payant à long terme. Une fois que tu auras les données tidy et les outils tidy fournis par les paquets du tidyverse, tu passeras beaucoup moins de temps à faire passer les données d'une représentation à une autre, ce qui te permettra de passer plus de temps sur les questions de données qui t'intéressent.
Dans ce chapitre, tu apprendras d'abord la définition des données bien rangées et tu verras qu'elle est appliquée à un simple jeu de données jouet. Ensuite, nous nous plongerons dans le principal outil que tu utiliseras pour mettre de l'ordre dans les données : le pivotement. Le pivotement te permet de modifier la forme de tes données sans changer aucune des valeurs.
Conditions préalables
Dans ce chapitre, nous allons nous concentrer sur tidyr, un paquetage qui fournit un tas d'outils pour t'aider à mettre de l'ordre dans tes ensembles ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access