Capitolo 4. Sotto il cofano: addestrare un classificatore di cifre
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Dopo aver visto come si addestra una serie di modelli nelCapitolo 2, diamo ora un'occhiata sotto il cofano e vediamo cosa succede esattamente. Inizieremo utilizzando la computer vision per introdurre gli strumenti e i concetti fondamentali del deep learning.
Per essere precisi, parleremo del ruolo degli array e dei tensori e del broadcasting, una potente tecnica per utilizzarli in modo espressivo. Spiegheremo la discesa stocastica del gradiente (SGD), il meccanismo per l'apprendimento tramite l'aggiornamento automatico dei pesi. Discuteremo la scelta di una funzione di perdita per il nostro compito di classificazione di base e il ruolo dei mini-batch. Descriveremo anche i calcoli che una rete neurale di base esegue. Infine, metteremo insieme tutti questi pezzi.
Nei prossimi capitoli faremo delle immersioni profonde anche in altre applicazioni e vedremo come questi concetti e strumenti si generalizzano. Ma questo capitolo è dedicato alla posa delle fondamenta. Ad essere sinceri, questo è anche uno dei capitoli più difficili, perché questi concetti dipendono l'uno dall'altro. Come in un arco, tutte le pietre devono essere al loro posto perché la struttura rimanga in piedi. E come un arco, una volta che ciò avviene, la struttura è potente e può sostenere altre cose. Ma richiede ...