library(tidyverse)
R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 16. Les facteurs
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
Les facteurs sont utilisés pour les variables catégorielles, les variables qui ont un ensemble fixe et connu de valeurs possibles. Ils sont également utiles lorsque tu veux afficher des vecteurs de caractères dans un ordre non alphabétique.
Nous commencerons par expliquer pourquoi les facteurs sont nécessaires à l'analyse des données1 et comment tu peux les créer avec factor(). Nous te présenterons ensuite l'ensemble de données gss_cat, qui contient un grand nombre de variables catégorielles avec lesquelles tu pourras faire des expériences. Tu utiliseras ensuite cet ensemble de données pour t'entraîner à modifier l'ordre et les valeurs des facteurs, avant de terminer par une discussion sur les facteurs ordonnés.
Conditions préalables
Base R fournit quelques outils de base pour créer et manipuler des facteurs. Nous les compléterons avec le paquetage forcats, qui fait partie du noyau tidyverse. Il fournit des outils pour traiter les variables catégorielles(et c'est un anagramme de factors !) en utilisant une large gamme d'aides pour travailler avec les facteurs.
Les bases du facteur
Imagine que tu aies une variable qui enregistre le mois :
x1<-c("Dec","Apr","Jan","Mar")
L'utilisation d'une chaîne de caractères pour enregistrer cette variable pose deux problèmes :
-
Il n'y a que 12 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access