Capitolo 11. Addestramento delle reti neurali profonde
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nel Capitolo 10 di hai costruito, addestrato e messo a punto diverse reti neurali artificiali utilizzando PyTorch. Ma si trattava di reti poco profonde, con pochi strati nascosti. E se devi affrontare un problema complesso, come il rilevamento di centinaia di tipi di oggetti in immagini ad alta risoluzione? Potresti aver bisogno di addestrare una RNA molto più profonda, magari con decine o addirittura centinaia di strati, ciascuno contenente centinaia di neuroni, collegati da centinaia di migliaia di connessioni. Addestrare una rete neurale profonda non è una passeggiata. Ecco alcuni dei problemi che potresti incontrare:
-
Potresti trovarti di fronte al problema dei gradienti che diventano sempre più piccoli o più grandi quando scorrono all'indietro attraverso la DNN durante l'addestramento. Entrambi questi problemi rendono gli strati inferiori molto difficili da addestrare.
-
Potresti non avere abbastanza dati di addestramento per una rete così grande, oppure potrebbe essere troppo costoso etichettare.
-
L'addestramento potrebbe essere estremamente lento.
-
Un modello con milioni di parametri rischia di sovraadattare il set di addestramento, soprattutto se non ci sono abbastanza istanze di addestramento o se sono troppo rumorose.
In questo capitolo esamineremo ciascuno di questi problemi ...