book

Think Stats, 3a edizione

Name: Think Stats, 3a edizione
Author: Allen B. Downey
ISBN: 9798341640016

by Allen B. Downey

April 2025

Intermediate to advanced

324 pages

7h 15m

Italian

O'Reilly Media, Inc.

Read now

Unlock full access

Prefazione
Cosa c'è di nuovo?Utilizzo del codiceConvenzioni utilizzate in questo libroFormazione online O'ReillyCome contattarciRingraziamenti
1. Analisi esplorativa dei dati
ProveL'indagine nazionale sulla crescita delle famiglieLeggere i datiConvalidaTrasformazioneStatistiche riassuntiveInterpretazioneGlossarioEserciziEsercizio 1.1Esercizio 1.2Esercizio 1.3
2. Distribuzioni
Tabelle di frequenzaDistribuzioni NSFGI valori fuori normaI primi bambiniDimensione dell'effettoRisultati dei rapportiGlossarioEserciziEsercizio 2.1Esercizio 2.2Esercizio 2.3
3. Funzioni di massa di probabilità
PMFRiassumere un PMFIl paradosso delle dimensioni delle classiDati NSFGAltre visualizzazioniGlossarioEserciziEsercizio 3.1Esercizio 3.2Esercizio 3.3
4. Funzioni di distribuzione cumulativa
Percentili e ranghi percentiliCDFConfronto tra CDFStatistiche basate sui percentiliNumeri casualiGlossarioEserciziEsercizio 4.1Esercizio 4.2Esercizio 4.3Esercizio 4.4Esercizio 4.5
5. Modellare le distribuzioni
La distribuzione binomialeLa distribuzione di PoissonLa distribuzione esponenzialeLa distribuzione normaleLa distribuzione lognormalePerché modellare?GlossarioEserciziEsercizio 5.1Esercizio 5.2Esercizio 5.3
6. Funzioni di densità di probabilità
Confronto tra distribuzioniDensità di probabilitàL'esponenziale PDFConfronto tra PMF e PDFStima della densità kernelIl quadro di distribuzioneGlossarioEserciziEsercizio 6.1Esercizio 6.2
7. Relazioni tra le variabili
Piani di dispersioneGrafici deciliCorrelazioneForza della correlazioneCorrelazione di rangoCorrelazione e causalitàGlossarioEserciziEsercizio 7.1Esercizio 7.2Esercizio 7.3Esercizio 7.4Esercizio 7.5
8. Stima
Pesare i pinguiniRobustezzaStima della varianzaDistribuzioni di campionamentoErrore standardIntervalli di confidenzaFonti di erroreGlossarioEserciziEsercizio 8.1Esercizio 8.2Esercizio 8.3Esercizio 8.4Esercizio 8.5Esercizio 8.6
9. Verifica delle ipotesi
Monete da girareTestare una differenza di mediaAltre statistiche del testTestare una correlazioneProva le proporzioniGlossarioEserciziEsercizio 9.1Esercizio 9.2

10. I minimi quadrati
Adattamento ai minimi quadratiCoefficiente di determinazioneMinimizzare l'MSEStimaVisualizzazione dell'incertezzaTrasformazioneGlossarioEserciziEsercizio 10.1Esercizio 10.2Esercizio 10.3
11. Regressione multipla
StatisticheModelliPassiamo alla regressione multiplaVariabili di controlloRelazioni non lineariRegressione logisticaGlossarioEserciziEsercizio 11.1Esercizio 11.2Esercizio 11.3Esercizio 11.4
12. Analisi delle serie temporali
ElettricitàDecomposizionePrevisioneModello moltiplicativoAutoregressioneMedia mobileRetrodatazione con autoregressioneARIMAPrevisione con ARIMAGlossarioEserciziEsercizio 12.1Esercizio 12.2Esercizio 12.3
13. Analisi della sopravvivenza
Funzioni di sopravvivenzaFunzione di rischioDati sul matrimonioBootstrap ponderatoStima delle funzioni di rischioStima delle funzioni di sopravvivenzaLinee di vitaIntervalli di confidenzaVita residua previstaGlossarioEserciziEsercizio 13.1Esercizio 13.2
14. Metodi analitici
Grafici di probabilità normaleDistribuzioni normaliDistribuzione delle medie del campioneDistribuzione delle differenzeTeorema del limite centraleI limiti del Teorema del Limite CentraleApplicazione del CLTTest di correlazioneTest del Chi-quadroCalcolo e analisiGlossarioEserciziEsercizio 14.1Esercizio 14.2Esercizio 14.3Esercizio 14.4
Indice
Informazioni sull'autore

Content preview from Think Stats, 3a edizione

Capitolo 2. Le distribuzioni

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Questo capitolo introduce una delle idee fondamentali della statistica, la distribuzione. Inizieremo con le tabelle di frequenza, che rappresentano i valori di un insieme di dati e il numero di volte in cui ciascuno di essi compare, e le useremo per esplorare i dati dell'Indagine Nazionale sulla Crescita delle Famiglie (NSFG). Cercheremo anche valori estremi o errati, chiamati outlier, e valuteremo come gestirli.

Tabelle di frequenza

Un modo per descrivere una variabile è una tabella di frequenza, che contiene i valori della variabile e le loro frequenze, cioèil numero di volte in cui ogni valore compare. Questa descrizione è chiamata distribuzione della variabile.

Per rappresentare le distribuzioni, utilizzeremo una libreria chiamata empiricaldist. In questo contesto, "empirico" significa che le distribuzioni sono basate su dati piuttosto che su modelli matematici. empiricaldist fornisce una classe chiamata FreqTab che possiamo utilizzare per calcolare e tracciare tabelle di frequenza. Possiamo importarla in questo modo:

from empiricaldist import FreqTab

Per mostrare come funziona, inizieremo con un piccolo elenco di valori:

t = [1.0, 2.0, 2.0, 3.0, 5.0]

FreqTab offre un metodo chiamato from_seq che prende una sequenza e crea un oggetto FreqTab:

ftab = FreqTab.from_seq(t)
ftab

	freqs
1.0	1
2.0

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341640016

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Think Stats, 3a edizione

by Allen B. Downey

Capitolo 2. Le distribuzioni

Tabelle di frequenza

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

Da monolite a microservizi

Algebra lineare pratica per la scienza dei dati

Imparare gli algoritmi

Introduzione a Python, 2a edizione

Publisher Resources

Capitolo 2. Le distribuzioni

Tabelle di frequenza

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

Da monolite a microservizi

Algebra lineare pratica per la scienza dei dati

Imparare gli algoritmi

Introduzione a Python, 2a edizione

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.