Capítulo 7. Visualización de distribuciones: Histogramas y gráficos de densidad

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Con frecuencia nos encontramos con la situación en la que nos gustaría comprender cómo se distribuye una determinada variable en un conjunto de datos. Para dar un ejemplo concreto, consideraremos los pasajeros del Titanic, un conjunto de datos que encontramos en el Capítulo 6. Había aproximadamente 1.300 pasajeros en el Titanic (sin contar a la tripulación), y tenemos las edades de 756 de ellos. Podríamos querer saber cuántos pasajeros de qué edades había en el Titanic, es decir, cuántos niños, jóvenes adultos, personas de mediana edad, ancianos, etc. Llamamos distribución por edades de los pasajeros a las proporciones relativas de las distintas edades entre los pasajeros.

Visualizar una única distribución

Podemos hacernos una idea de la distribución de edades entre los pasajeros agrupando a todos los pasajeros en franjas de edades comparables y contando después el número de pasajeros de cada franja. Este procedimiento da como resultado una tabla como la Tabla 7-1.

Tabla 7-1. Número de pasajeros de edad conocida del Titanic.
Rango de edad Cuenta

0-5

36

6-10

19

11-15

18

16-20

99

21-25

139

26-30

121

Rango de edad Cuenta

31-35

76

36-40

74

41-45

54

46-50

50

51-55

26

56-60

22

Rango de edad Cuenta

61-65

16

66-70

3

71-75

3

Podemos ...

Get Fundamentos de la visualización de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.