Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 10. Trabajar con datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Los expertos suelen poseer más datos que criterio.

Colin Powell

Trabajar con datos es tanto un arte como una ciencia. Hemos hablado sobre todo de la parte científica, pero en este capítulo veremos algo del arte.

Explorar tus datos

Después de has identificado las preguntas que intentas responder y te has hecho con algunos datos, puedes tener la tentación de zambullirte y empezar inmediatamente a construir modelos y obtener respuestas. Pero debes resistir este impulso. Tu primer paso debe ser explorar tus datos.

Explorar datos unidimensionales

El caso más sencillo es cuando tienes un conjunto de datos unidimensional, que no es más que una colección de números. Por ejemplo, podrían ser la media diaria de minutos que cada usuario pasa en tu sitio, el número de veces que se ha visto cada uno de una colección de vídeos tutoriales de ciencia de datos, o el número de páginas de cada uno de los libros de ciencia de datos de tu biblioteca de ciencia de datos.

Un primer paso obvio es calcular unos cuantos estadísticos de resumen. Te gustaría saber cuántos puntos de datos tienes, el más pequeño, el más grande, la media y la desviación típica.

Pero ni siquiera éstos te proporcionan necesariamente una gran comprensión. Un buen paso siguiente es crear un histograma, en el que agrupas tus datos en cubos discretos y cuentas cuántos puntos caen ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625