Kapitel 8. Datenmanipulation und Visualisierung in R
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Der amerikanische Statistiker Ronald Thisted hat einmal gewitzelt: "Rohe Daten müssen, wie rohe Kartoffeln, vor der Verwendung gereinigt werden." Datenmanipulation braucht Zeit, und du kennst den Schmerz, wenn du schon einmal Folgendes getan hast:
-
Berechnete Spalten auswählen, ablegen oder erstellen
-
Zeilen sortieren oder filtern
-
Nach Kategorien gruppieren und zusammenfassen
-
Mehrere Datensätze über ein gemeinsames Feld verbinden
Wahrscheinlich hast du all das schon in Excel gemacht...sehr oft, und du hast dich wahrscheinlich in gefeierte Funktionen wie VLOOKUP()
und PivotTables vertieft, um sie zu erreichen. In diesem Kapitel lernst du die Entsprechungen dieser Techniken in R kennen, insbesondere mit Hilfe von dplyr
.
Datenmanipulation geht oft Hand in Hand mit Visualisierung: Wie bereits erwähnt, sind wir Menschen bemerkenswert geschickt darin, Informationen visuell zu verarbeiten, und das ist eine großartige Möglichkeit, einen Datensatz zu bewerten. Du lernst, wie du Daten mit dem großartigen Paket ggplot2
visualisieren kannst, das wie dplyr
Teil des Pakets tidyverse
ist. Damit hast du eine solide Grundlage, um Beziehungen in Daten mit R zu untersuchen und zu testen, was in Kapitel 9 behandelt wird. Beginnen wir damit, die entsprechenden Pakete aufzurufen. In diesem Kapitel werden wir ...
Get Vorstoß in die Analytik now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.