Capítulo 7. Explorar los datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Después de todo ese duro trabajo (a menos que ya tuvieras datos limpios por ahí), es hora de divertirse. Ahora que has obtenido y depurado tus datos, puedes continuar con el tercer paso del modelo OSEMN, que consiste en explorar tus datos.

Explorar es el paso en el que te familiarizas con los datos. Estar familiarizado con los datos es esencial cuando quieres extraer algún valor de ellos. Por ejemplo, saber qué tipo de características tienen los datos significa que sabes qué características merece la pena explorar más a fondo y cuáles puedes utilizar para responder a cualquier pregunta que tengas.

Explorar tus datos puede hacerse desde tres perspectivas. La primera perspectiva es inspeccionar los datos y sus propiedades. Aquí, quieres averiguar cosas como qué aspecto tienen los datos en bruto, cuántos puntos de datos tiene el conjunto de datos y qué características tiene el conjunto de datos.

La segunda consiste en calcular estadísticas descriptivas. La salida suele ser breve y textual, por lo que puede imprimirse en la línea de comandos.

La tercera perspectiva consiste en crear visualizaciones de los datos. Desde esta perspectiva puedes obtener una visión de cómo interactúan múltiples características. Discutiré una forma de crear visualizaciones que pueden imprimirse en la línea de comandos. Sin embargo, las visualizaciones son más ...

Get Ciencia de datos en la línea de comandos, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.