library(tidyverse)
R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 18. Valeurs manquantes
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
Tu as déjà appris les bases des valeurs manquantes plus tôt dans le livre. Tu les as vues pour la première fois au chapitre 1, où elles ont donné lieu à un avertissement lors de la création d'un graphique, ainsi que dans "summarize()", où elles ont perturbé le calcul des statistiques récapitulatives, et tu as appris leur nature infectieuse et comment vérifier leur présence dans "Valeurs manquantes". Nous allons maintenant y revenir plus en profondeur pour que tu puisses en apprendre davantage sur les détails.
Nous commencerons par discuter de quelques outils généraux pour travailler avec des valeurs manquantes enregistrées sur NAs. Nous explorerons ensuite l'idée des valeurs implicitement manquantes, des valeurs qui sont simplement absentes de tes données, et nous montrerons quelques outils que tu peux utiliser pour les rendre explicites. Nous terminerons par une discussion sur les groupes vides, causés par des niveaux de facteurs qui n'apparaissent pas dans les données.
Conditions préalables
Les fonctions permettant de travailler avec des données manquantes proviennent principalement de dplyr et de tidyr, qui sont des membres essentiels de tidyverse.
Valeurs manquantes explicites
Pour commencer, explorons quelques outils pratiques pour créer ou éliminer les valeurs explicites manquantes, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access