Capítulo 8. Visualización de distribuciones: Funciones empíricas de distribución acumulativa y gráficos Q-Q

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 7, describí cómo podemos visualizar las distribuciones con histogramas o gráficos de densidad. Ambos enfoques son intuitivos y visualmente atractivos. Sin embargo, como ya se comentó en ese capítulo, ambos comparten la limitación de que la figura resultante depende en gran medida de los parámetros que tenga que elegir el usuario, como la anchura de los intervalos en los histogramas y el ancho de banda en los gráficos de densidad. En consecuencia, ambos deben considerarse una interpretación de los datos más que una visualización directa de los datos en sí.

Como alternativa al uso de histogramas o gráficos de densidad, podríamos simplemente mostrar todos los puntos de datos individualmente, como una nube de puntos. Sin embargo, este enfoque se vuelve difícil de manejar para conjuntos de datos muy grandes y, en cualquier caso, hay valor en los métodos agregados que destacan las propiedades de la distribución en lugar de los puntos de datos individuales. Para resolver este problema, los estadísticos han inventado las funciones de distribución acumulativa empírica (FDCE) y los gráficos cuantil-cuantil (q-q). Estos tipos de visualizaciones no requieren la elección arbitraria de parámetros, y muestran todos los datos a la vez. Por desgracia, son un ...

Get Fundamentos de la visualización de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.