Capitolo 4. Funzioni di distribuzione cumulativa
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Le tabelle di frequenza e le PMF sono i modi più familiari per rappresentare le distribuzioni, ma come vedremo in questo capitolo, hanno dei limiti. Un'alternativa è la funzione di distribuzione cumulativa (CDF), utile per calcolare i percentili e soprattutto per confrontare le distribuzioni.
Sempre in questo capitolo, calcoleremo le statistiche basate sui percentili per quantificare la posizione, la diffusione e la skewness di una distribuzione.
Percentili e ranghi percentili
Se hai fatto un test standardizzato, probabilmente hai ricevuto i tuoi risultati sotto forma di un punteggio grezzo e di un rank percentile. In questo contesto, il percentile è la percentuale di persone che hanno ottenuto il tuo stesso punteggio o un punteggio inferiore. Quindi, se sei "nel 90° percentile", hai fatto bene o meglio del 90% delle persone che hanno partecipato all'esame.
Per capire i percentili e le classifiche percentili, consideriamo un esempio basato sulla velocità di corsa. Alcuni anni fa ho corso la James Joyce Ramble, una corsa su strada di 10 chilometri nel Massachusetts. Dopo la gara, ho scaricato i risultati per vedere il mio tempo rispetto agli altri corridori.
Le istruzioni per scaricare i dati sono contenute nel blocco note di questo capitolo. Il modulo relay.py fornisce una funzione che legge ...