Capitolo 9. Approfondimento sulla modellazione tabellare
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
La modellazione tabellare prende i dati sotto forma di tabella (come un foglio di calcoloo CSV). L'obiettivo è prevedere il valore di una colonna in base ai valori delle altre colonne. In questo capitolo esamineremo non solo il deep learning, ma anche tecniche di apprendimento automatico più generali come le foreste casuali, che possono dare risultati migliori a seconda del problema.
Vedremo come preprocessare e pulire i dati e come interpretare i risultati dei nostri modelli dopo l'addestramento, ma prima vedremo come inserire le colonne che contengono categorie in un modello che si aspetta dei numeri utilizzando gli embeddings.
Incorporazioni categoriali
Nei dati tabellari, alcune colonne possono contenere dati numerici, come "età", mentrealtre contengono valori stringa, come "sesso". I dati numerici possono essere inseriti direttamente nel modello (con una preelaborazione opzionale), ma le altre colonne devono essere convertite in numeri. Poiché i valori in esse contenuti corrispondono a diverse categorie, spesso chiamiamo questo tipo di variabili variabili categoriche. Il primo tipo è chiamatovariabili continue.
Gergo: Variabili continue e categoriche
Le variabili continue sono dati numerici, come ad esempio "età", che possono essere inseriti direttamente nel modello, in quanto ...