Kapitel 6. Zusammengefasste Datenverteilungen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel erfährst du, wie du zusammengefasste Verteilungen von Daten visualisieren kannst.

6.1 Erstellen eines einfachen Histogramms

Problem

Du möchtest ein Histogramm erstellen.

Lösung

Verwende geom_histogram() und ordne x eine kontinuierliche Variable zu(Abbildung 6-1):

ggplot(faithful, aes(x = waiting)) +
  geom_histogram()
A basic histogram
Abbildung 6-1. Ein grundlegendes Histogramm

Diskussion

Alles, was geom_histogram() benötigt, ist eine Spalte aus einem Datenrahmen oder ein einzelner Datenvektor. Für dieses Beispiel verwenden wir den Datensatz faithful, der zwei Spalten mit Daten über den Geysir Old Faithful enthält:eruptions, die die Dauer jedes Ausbruchs angibt, und waiting, die die Dauer bis zum nächsten Ausbruch angibt. In diesem Beispiel verwenden wir nur die Variable waiting:

faithful
#>     eruptions waiting
#> 1       3.600      79
#> 2       1.800      54
#> 3       3.333      74
#>  ...<266 more rows>...
#> 270     4.417      90
#> 271     1.817      46
#> 272     4.467      74

Wenn du nur einen schnellen Blick auf Daten werfen willst, die sich nicht in einem Datenrahmen befinden, kannst du das gleiche Ergebnis erzielen, indem du NULL für den Datenrahmen und ggplot() einen Vektor mit Werten übergibst. Das Ergebnis ist dasselbe wie das des vorherigen ...

Get R Graphics Cookbook, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.