Capitolo 11. Regressione multipla
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
L'adattamento ai minimi quadrati lineari del capitolo precedente è un esempio di regressione, ovvero il problema più generale di modellare la relazione tra un insieme di variabili, chiamate variabili di risposta o variabili dipendenti, e un altro insieme di variabili, chiamate variabili esplicative o variabili indipendenti.
Negli esempi del capitolo precedente, c'è una sola variabile di risposta e una sola variabile esplicativa, che si chiama regressione semplice. In questo capitolo, passiamo alla regressione multipla, con più di una variabile esplicativa, ma sempre con una sola variabile di risposta. Se c'è più di una variabile di risposta, si parla di regressione multivariata, che non verrà trattata in questo libro.
StatisticheModelli
Nel capitolo precedente abbiamo utilizzato la funzione SciPy linregress per calcolare i minimi quadrati. Questa funzione esegue una regressione semplice, ma non una regressione multipla. Per questo useremo StatsModels, un pacchetto che fornisce diverse forme di regressione e altre analisi.
Come primo esempio, continueremo a esplorare i dati dei pinguini. Quando caricheremo i dati, useremo il seguente dizionario per dare alle colonne nomi che non contengano spazi, in modo da renderli più facili da usare con StatsModels:
columns={"Body Mass (g)":"mass","Flipper Length ...