Estadística Práctica para Científicos de Datos, 2ª Edición
by Peter Bruce, Andrew Bruce, Peter Gedeck
Capítulo 1. Análisis exploratorio de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Este capítulo se centra en el primer paso de cualquier proyecto de ciencia de datos: explorar los datos.
La estadística clásica se centraba casi exclusivamente en la inferencia, un conjunto a veces complejo de procedimientos para extraer conclusiones sobre grandes poblaciones a partir de muestras pequeñas. En 1962, John W. Tukey(Figura 1-1) pidió una reforma de la estadística en su artículo seminal "El futuro del análisis de datos" [Tukey-1962]. Propuso una nueva disciplina científica llamada análisis de datos que incluía la inferencia estadística como uno solo de sus componentes. Tukey forjó vínculos con las comunidades de ingeniería e informática (acuñó los términos bit, abreviatura de dígito binario, y software), y sus principios originales son sorprendentemente duraderos y forman parte de los cimientos de la ciencia de datos.El campo del análisis exploratorio de datos se estableció con el libro de Tukey de 1977, ahora clásico, Análisis exploratorio de datos [Tukey-1977]. Tukey presentó gráficos sencillos (p. ej., gráficos de caja, gráficos de dispersión) que, junto con estadísticas de resumen (media, mediana, cuantiles, etc.), ayudan a dibujar una imagen de un conjunto de datos.
Con la fácil disponibilidad de potencia informática y programas expresivos de análisis de datos, el análisis exploratorio de datos ha evolucionado ...