Skip to Content
Think Stats, 3a edizione
book

Think Stats, 3a edizione

by Allen B. Downey
April 2025
Intermediate to advanced
324 pages
7h 15m
Italian
O'Reilly Media, Inc.
Content preview from Think Stats, 3a edizione

Capitolo 2. Le distribuzioni

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Questo capitolo introduce una delle idee fondamentali della statistica, la distribuzione. Inizieremo con le tabelle di frequenza, che rappresentano i valori di un insieme di dati e il numero di volte in cui ciascuno di essi compare, e le useremo per esplorare i dati dell'Indagine Nazionale sulla Crescita delle Famiglie (NSFG). Cercheremo anche valori estremi o errati, chiamati outlier, e valuteremo come gestirli.

Tabelle di frequenza

Un modo per descrivere una variabile è una tabella di frequenza, che contiene i valori della variabile e le loro frequenze, cioèil numero di volte in cui ogni valore compare. Questa descrizione è chiamata distribuzione della variabile.

Per rappresentare le distribuzioni, utilizzeremo una libreria chiamata empiricaldist. In questo contesto, "empirico" significa che le distribuzioni sono basate su dati piuttosto che su modelli matematici. empiricaldist fornisce una classe chiamata FreqTab che possiamo utilizzare per calcolare e tracciare tabelle di frequenza. Possiamo importarla in questo modo:

from empiricaldist import FreqTab

Per mostrare come funziona, inizieremo con un piccolo elenco di valori:

t = [1.0, 2.0, 2.0, 3.0, 5.0]

FreqTab offre un metodo chiamato from_seq che prende una sequenza e crea un oggetto FreqTab:

ftab = FreqTab.from_seq(t)
ftab
freqs
1.0 1
2.0
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Da monolite a microservizi

Da monolite a microservizi

Sam Newman
Imparare gli algoritmi

Imparare gli algoritmi

George Heineman

Publisher Resources

ISBN: 9798341640016