Skip to Content
Ciencia de datos desde cero, 2ª edición
book

Ciencia de datos desde cero, 2ª edición

by Joel Grus
September 2024
Intermediate to advanced
406 pages
9h 44m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos desde cero, 2ª edición

Capítulo 5. Estadísticas

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Los hechos son obstinados, pero las estadísticas son más flexibles.

Mark Twain

Estadística se refiere a las matemáticas y técnicas con las que comprendemos los datos. Es un campo rico y enorme, más adecuado para una estantería (o sala) de una biblioteca que para un capítulo de un libro, por lo que nuestro debate no será necesariamente profundo. En su lugar, intentaré enseñarte lo justo para que sea peligroso, y despertar tu interés lo suficiente para que vayas a aprender más.

Describir un único conjunto de datos

A través de una combinación de boca a boca y suerte, DataSciencester ha crecido hasta tener docenas de miembros, y el vicepresidente de recaudación de fondos te pide algún tipo de descripción de cuántos amigos tienen tus miembros que pueda incluir en sus elevator pitches.

Utilizando las técnicas del Capítulo 1, puedes producir fácilmente estos datos. Pero ahora te enfrentas al problema de cómo describirlos.

Una descripción obvia de cualquier conjunto de datos son simplemente los propios datos:

num_friends = [100, 49, 41, 40, 25,
               # ... and lots more
              ]

Para un conjunto de datos lo suficientemente pequeño, ésta podría ser incluso la mejor descripción. Pero para un conjunto de datos más grande, esto es difícil de manejar y probablemente opaco. (Imagina mirar una lista de 1 millón de números.) Por eso, utilizamos la estadística para ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Ciencia de datos en AWS

Ciencia de datos en AWS

Chris Fregly, Antje Barth

Publisher Resources

ISBN: 9781098182625