R pour la science des données, 2e édition
by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund
Chapitre 10. Analyse exploratoire des données
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Introduction
Ce chapitre te montrera comment utiliser la visualisation et la transformation pour explorer tes données de façon systématique, une tâche que les statisticiens appellent l'analyse exploratoire des données, ou EDA en abrégé. L'AED est un cycle itératif. Tu.. :
Génère des questions sur tes données.
Cherche des réponses en visualisant, transformant et modélisant tes données.
Utilise ce que tu as appris pour affiner tes questions et/ou en générer de nouvelles.
L'AED n'est pas un processus formel avec un ensemble de règles strictes. L'AED est avant tout un état d'esprit. Pendant les phases initiales de l'AED, tu dois te sentir libre d'étudier toutes les idées qui te viennent à l'esprit. Certaines de ces idées seront fructueuses, d'autres seront des impasses. Au fur et à mesure de ton exploration, tu trouveras quelques idées particulièrement productives que tu finiras par rédiger et communiquer aux autres.
L'AED est une partie importante de toute analyse de données, même si les questions de recherche primaire te sont données sur un plateau, parce que tu dois toujours enquêter sur la qualité de tes données. Le nettoyage des données n'est qu'une application de l'EDA : tu poses des questions pour savoir si tes données répondent à tes attentes. Pour nettoyer les données, tu devras déployer tous les ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access