R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 21. Les bases de données
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
Une énorme quantité de données vit dans les bases de données, il est donc essentiel que tu saches comment y accéder. Parfois, tu peux demander à quelqu'un de télécharger un instantané dans un fichier .csv pour toi, mais cela devient vite pénible : chaque fois que tu auras besoin de faire un changement, tu devras communiquer avec un autre humain. Tu veux pouvoir accéder directement à la base de données pour obtenir les données dont tu as besoin, quand tu en as besoin.
Dans ce chapitre, tu vas d'abord apprendre les bases du package DBI : comment l'utiliser pour se connecter à une base de données, puis récupérer des données avec une requête SQL.1 à l'aide d'une requête SQL. SQL, abréviation de Structured Query Language, est la lingua franca des bases de données et constitue un langage important à apprendre pour tous les data scientists. Cela dit, nous n'allons pas commencer par le SQL, mais à la place, nous allons t'apprendre dbplyr, qui peut traduire ton code dplyr en SQL. Nous utiliserons cela comme un moyen de t'enseigner certaines des fonctionnalités les plus importantes de SQL. Tu ne deviendras pas un maître du SQL à la fin du chapitre, mais tu seras capable d'identifier les composants les plus importants et de comprendre ce qu'ils font.
Conditions préalables
Dans ce chapitre, nous allons présenter ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access