Capitolo 19. Apprendimento per rinforzo
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
L'apprendimento per rinforzo (RL) è uno dei campi più interessanti dell'apprendimento automatico e anche uno dei più antichi. Esiste dagli anni '50 e nel corso degli anni ha prodotto molte applicazioni interessanti.1 in particolare nei giochi (ad esempio TD-Gammon, un programma per giocare a backgammon) e nel controllo delle macchine, ma raramente ha fatto notizia. Tuttavia, una rivoluzione è avvenuta nel 2013, quando i ricercatori di una startup britannica chiamata DeepMind2 hanno dimostrato un sistema in grado di imparare a giocare a qualsiasi gioco Atari partendo da zero.3 superando gli esseri umani4 nella maggior parte di essi, utilizzando solo pixel grezzi come input e senza alcuna conoscenza preliminare delle regole dei giochi.5 Questa è stata la prima di una serie di imprese incredibili:
-
Nel 2016 AlphaGo di DeepMind ha battuto Lee Sedol, un leggendario giocatore professionista di Go, e nel 2017 ha battuto Ke Jie, il campione del mondo. Nessun programma si era mai avvicinato a battere un maestro di questo gioco, tanto meno il migliore.
-
Nel 2020, DeepMind ha rilasciato AlphaFold, in grado di prevedere la forma 3D delle proteine con una precisione senza precedenti. Si tratta di una novità assoluta per la biologia, la chimica e la medicina. Infatti, Demis Hassabis (fondatore e CEO) e John Jumper ...