Capitolo 10. Approfondimento sulla PNL: RNN
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nel Capitolo 1 abbiamo visto che il deep learning può essere utilizzato per ottenere ottimi risultati con i dataset in linguaggio naturale. Il nostro esempio si basava sull'utilizzo di un modello linguistico pre-addestrato e sulla sua messa a punto per classificare le recensioni. Quell'esempio ha evidenziato una differenza tra l'apprendimento per trasferimento in PNL e la computer vision: in generale, in PNL il modello pre-addestrato viene addestrato su un compito diverso.
Quello che chiamiamo modello linguistico è un modello che è stato addestrato per indovinare la parola successiva in un testo (dopo aver letto quelle precedenti). Questo tipo di attività si chiama apprendimento auto-supervisionato: non è necessario fornire etichette al nostro modello, ma basta dargli in pasto moltissimi testi. Il modello ha un processo per ricavare automaticamente le etichette dai dati e questo compito non è banale: per indovinare correttamente la parola successiva in una frase, il modello dovrà sviluppare una comprensione della lingua inglese (o di altre lingue). L'apprendimento auto-supervisionato può essere utilizzato anche in altri ambiti; ad esempio, consulta"Self-Supervised Learning and Computer Vision" per un'introduzione alle applicazioni di visione. L'apprendimento auto-supervisionato non viene solitamente ...