library(tidyverse)
R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 7. Importation de données
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
Travailler avec des données fournies par des paquets R est un excellent moyen d'apprendre les outils de la science des données, mais tu veux appliquer ce que tu as appris à tes propres données à un moment ou à un autre. Dans ce chapitre, tu apprendras les bases de la lecture de fichiers de données dans R.
Plus précisément, ce chapitre se concentre sur la lecture de fichiers rectangulaires en texte brut. Nous commencerons par des conseils pratiques pour gérer des caractéristiques telles que les noms de colonnes, les types et les données manquantes. Tu apprendras ensuite à lire des données à partir de plusieurs fichiers à la fois et à écrire des données de R vers un fichier. Enfin, tu apprendras à créer des cadres de données dans R.
Conditions préalables
Dans ce chapitre, tu apprendras à charger des fichiers plats dans R avec le package readr, qui fait partie du core tidyverse :
Lire les données d'un fichier
Pour commencer, nous allons nous concentrer sur le type de fichier de données rectangulaires le plus courant : CSV, qui est l'abréviation de "comma-separated values" (valeurs séparées par des virgules). Voici à quoi ressemble un fichier CSV simple. La première ligne, communément appelée ligne d'en-tête, donne les noms des colonnes, et les six lignes suivantes fournissent les ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access