Capítulo 6. Distribuciones de Datos Resumidos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Este capítulo explora cómo visualizar distribuciones resumidas de datos.

6.1 Hacer un histograma básico

Problema

En querrás hacer un histograma.

Solución

Utiliza geom_histogram() y asigna una variable continua a x (Figura 6-1):

ggplot(faithful, aes(x = waiting)) +
  geom_histogram()
A basic histogram
Figura 6-1. Un histograma básico

Debate

Todo lo que requiere geom_histogram() es una columna de un marco de datos o un único vector de datos. Para este ejemplo utilizaremos el conjunto de datos faithful, que contiene dos columnas con datos sobre el géiser Old Faithful:eruptions, que es la duración de cada erupción, y waiting, que es el tiempo que falta para la siguiente erupción. En este ejemplo sólo utilizaremos la variable waiting:

faithful
#>     eruptions waiting
#> 1       3.600      79
#> 2       1.800      54
#> 3       3.333      74
#>  ...<266 more rows>...
#> 270     4.417      90
#> 271     1.817      46
#> 272     4.467      74

Si sólo quieres echar un vistazo rápido a algunos datos que no están en un marco de datos, puedes obtener el mismo resultado pasando NULL para el marco de datos y dando a ggplot() un vector de valores. Esto tendría el mismo resultado que el código anterior:

# Store the values in a simple vector
w <- faithful$waiting

ggplot(NULL, aes(x = w)) +
  geom_histogram()

Get R Graphics Cookbook, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.