Skip to Content
Ciencia de datos en la línea de comandos, 2ª edición
book

Ciencia de datos en la línea de comandos, 2ª edición

by Jeroen Janssens
October 2024
Intermediate to advanced
282 pages
6h 36m
Spanish
O'Reilly Media, Inc.
Content preview from Ciencia de datos en la línea de comandos, 2ª edición

Capítulo 7. Explorar los datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Después de todo ese duro trabajo (a menos que ya tuvieras datos limpios por ahí), es hora de divertirse. Ahora que has obtenido y depurado tus datos, puedes continuar con el tercer paso del modelo OSEMN, que consiste en explorar tus datos.

Explorar es el paso en el que te familiarizas con los datos. Estar familiarizado con los datos es esencial cuando quieres extraer algún valor de ellos. Por ejemplo, saber qué tipo de características tienen los datos significa que sabes qué características merece la pena explorar más a fondo y cuáles puedes utilizar para responder a cualquier pregunta que tengas.

Explorar tus datos puede hacerse desde tres perspectivas. La primera perspectiva es inspeccionar los datos y sus propiedades. Aquí, quieres averiguar cosas como qué aspecto tienen los datos en bruto, cuántos puntos de datos tiene el conjunto de datos y qué características tiene el conjunto de datos.

La segunda consiste en calcular estadísticas descriptivas. La salida suele ser breve y textual, por lo que puede imprimirse en la línea de comandos.

La tercera perspectiva consiste en crear visualizaciones de los datos. Desde esta perspectiva puedes obtener una visión de cómo interactúan múltiples características. Discutiré una forma de crear visualizaciones que pueden imprimirse en la línea de comandos. Sin embargo, las visualizaciones son más ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Estadística Práctica para Científicos de Datos, 2ª Edición

Estadística Práctica para Científicos de Datos, 2ª Edición

Peter Bruce, Andrew Bruce, Peter Gedeck
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner

Publisher Resources

ISBN: 9798341603790Supplemental Content