Capitolo 1. Analisi esplorativa dei dati
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
La tesi di questo libro è che possiamo usare i dati per rispondere a domande, risolvere dibattiti e prendere decisioni migliori.
Questo capitolo introduce i passaggi che utilizzeremo per farlo: caricare e convalidare i dati, esplorare e scegliere le statistiche che misurano ciò che ci interessa. A titolo di esempio, utilizzeremo i dati della National Survey of Family Growth (NSFG) per rispondere a una domanda che mi sono sentito rivolgere quando io e mia moglie aspettavamo il nostro primo figlio: i primi figli tendono ad arrivare in ritardo?
Prove
Potresti aver sentito dire che primo figlio è più probabile che sia in ritardo. Se fai una ricerca sul web con questa domanda, troverai molte discussioni. Alcuni sostengono che sia vero, altri che sia un mito e altri ancora che sia il contrario: i primi figli arrivano in anticipo.
In molte di queste discussioni, le persone forniscono dati a sostegno delle loro affermazioni. Ho trovato molti esempi come questi:
"Le mie due amiche che hanno partorito di recente i loro primi figli, hanno entrambe avuto un ritardo di quasi 2 settimane prima di entrare in travaglio o di essere indotte".
"Il mio primo è arrivato con due settimane di ritardo e ora credo che il secondo uscirà con due settimane di anticipo!!!".
"Non credo che possa essere vero, perché mia sorella ...