Kapitel 8. Datenmanipulation und Visualisierung in R

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Der amerikanische Statistiker Ronald Thisted hat einmal gewitzelt: "Rohe Daten müssen, wie rohe Kartoffeln, vor der Verwendung gereinigt werden." Datenmanipulation braucht Zeit, und du kennst den Schmerz, wenn du schon einmal Folgendes getan hast:

  • Berechnete Spalten auswählen, ablegen oder erstellen

  • Zeilen sortieren oder filtern

  • Nach Kategorien gruppieren und zusammenfassen

  • Mehrere Datensätze über ein gemeinsames Feld verbinden

Wahrscheinlich hast du all das schon in Excel gemacht...sehr oft, und du hast dich wahrscheinlich in gefeierte Funktionen wie VLOOKUP() und PivotTables vertieft, um sie zu erreichen. In diesem Kapitel lernst du die Entsprechungen dieser Techniken in R kennen, insbesondere mit Hilfe von dplyr.

Datenmanipulation geht oft Hand in Hand mit Visualisierung: Wie bereits erwähnt, sind wir Menschen bemerkenswert geschickt darin, Informationen visuell zu verarbeiten, und das ist eine großartige Möglichkeit, einen Datensatz zu bewerten. Du lernst, wie du Daten mit dem großartigen Paket ggplot2 visualisieren kannst, das wie dplyr Teil des Pakets tidyverse ist. Damit hast du eine solide Grundlage, um Beziehungen in Daten mit R zu untersuchen und zu testen, was in Kapitel 9 behandelt wird. Beginnen wir damit, die entsprechenden Pakete aufzurufen. In diesem Kapitel werden wir ...

Get Vorstoß in die Analytik now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.