Capítulo 10. Análisis exploratorio de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Introducción

Este capítulo te mostrará cómo utilizar la visualización y la transformación para explorar tus datos de forma sistemática, una tarea que los estadísticos llaman análisis exploratorio de datos, o AED para abreviar. El AED es un ciclo iterativo. Tú:

  1. Genera preguntas sobre tus datos.

  2. Busca respuestas visualizando, transformando y modelando tus datos.

  3. Utiliza lo que aprendas para perfeccionar tus preguntas y/o generar otras nuevas.

El AED no es un proceso formal con un conjunto estricto de normas. Más que nada, el AED es un estado mental. Durante las fases iniciales del AED debes sentirte libre para investigar todas las ideas que se te ocurran. Algunas de estas ideas darán resultado, y otras serán callejones sin salida. A medida que continúes explorando, encontrarás algunas ideas especialmente productivas que acabarás escribiendo y comunicando a los demás.

El AED es una parte importante de cualquier análisis de datos, incluso si las preguntas de la investigación primaria te las ponen en bandeja, porque siempre tienes que investigar la calidad de tus datos. La limpieza de datos es sólo una aplicación del AED: te preguntas si tus datos cumplen tus expectativas. Para hacer limpieza de datos, necesitarás implementar todas las herramientas de EDA: visualización, transformación y modelización.

Requisitos previos

Get R para la Ciencia de Datos, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.