Capitolo 4. L'addestramento dei modelli
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Finora abbiamo trattato i modelli di apprendimento automatico e i loro algoritmi di addestramento per lo più come scatole nere. Se hai affrontato alcuni degli esercizi dei capitoli precedenti, potresti essere rimasto sorpreso da quanto si possa fare senza sapere nulla di quello che c'è sotto il cofano: hai ottimizzato un sistema di regressione, hai migliorato un classificatore di immagini di cifre e hai persino costruito un classificatore di spam da zero, il tutto senza sapere come funzionano realmente. In effetti, in molte situazioni non è necessario conoscere i dettagli dell'implementazione.
Tuttavia, avere una buona conoscenza del funzionamento può aiutarti a individuare rapidamente il modello più adatto, il giusto algoritmo di addestramento da utilizzare e un buon set di iperparametri per il tuo compito. Capire cosa c'è sotto il cofano ti aiuterà anche a eseguire il debug dei problemi e l'analisi degli errori in modo più efficiente. Infine, la maggior parte degli argomenti trattati in questo capitolo saranno essenziali per comprendere, costruire e addestrare le reti neurali (di cui si parla nella Parte II di questo libro).
In questo capitolo inizieremo ad analizzare il modello di regressione lineare, uno dei modelli più semplici che esistano. Discuteremo due modi molto diversi di addestrarlo: