Capítulo 8. Visualização de distribuições: Funções de distribuição acumulada empírica e gráficos Q-Q
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
No Capítulo 7, descrevi como podemos visualizar distribuições com histogramas ou gráficos de densidade. Ambas as abordagens são intuitivas e visualmente apelativas. No entanto, tal como referido nesse capítulo, ambas partilham a limitação de a figura resultante depender, em grande medida, dos parâmetros que o utilizador tem de escolher, como a largura de caixa para os histogramas e a largura de banda para os gráficos de densidade. Consequentemente, ambos têm de ser considerados como uma interpretação dos dados e não como uma visualização direta dos próprios dados.
Como alternativa à utilização de histogramas ou gráficos de densidade, poderíamos simplesmente mostrar todos os pontos de dados individualmente, como uma Cloud de pontos. No entanto, esta abordagem torna-se difícil de manejar para conjuntos de dados muito grandes e, em qualquer caso, há valor nos métodos agregados que realçam as propriedades da distribuição em vez dos pontos de dados individuais. Para resolver este problema, os estatísticos inventaram as funções de distribuição cumulativa empírica (ECDF) e os gráficos de quantil-quantil (q-q). Estes tipos de visualizações não requerem escolhas arbitrárias de parâmetros e mostram todos os dados de uma só vez. Infelizmente, são um pouco menos intuitivas ...