Skip to Content
Machine learning pratico con Scikit-Learn e PyTorch
book

Machine learning pratico con Scikit-Learn e PyTorch

by Aurélien Géron
October 2025
Intermediate to advanced
878 pages
28h 57m
Italian
O'Reilly Media, Inc.
Book available
Content preview from Machine learning pratico con Scikit-Learn e PyTorch

Capitolo 19. Apprendimento per rinforzo

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

L'apprendimento per rinforzo (RL) è uno dei campi più interessanti dell'apprendimento automatico e anche uno dei più antichi. Esiste dagli anni '50 e nel corso degli anni ha prodotto molte applicazioni interessanti.1 in particolare nei giochi (ad esempio TD-Gammon, un programma per giocare a backgammon) e nel controllo delle macchine, ma raramente ha fatto notizia. Tuttavia, una rivoluzione è avvenuta nel 2013, quando i ricercatori di una startup britannica chiamata DeepMind2 hanno dimostrato un sistema in grado di imparare a giocare a qualsiasi gioco Atari partendo da zero.3 superando gli esseri umani4 nella maggior parte di essi, utilizzando solo pixel grezzi come input e senza alcuna conoscenza preliminare delle regole dei giochi.5 Questa è stata la prima di una serie di imprese incredibili:

  • Nel 2016 AlphaGo di DeepMind ha battuto Lee Sedol, un leggendario giocatore professionista di Go, e nel 2017 ha battuto Ke Jie, il campione del mondo. Nessun programma si era mai avvicinato a battere un maestro di questo gioco, tanto meno il migliore.

  • Nel 2020, DeepMind ha rilasciato AlphaFold, in grado di prevedere la forma 3D delle proteine con una precisione senza precedenti. Si tratta di una novità assoluta per la biologia, la chimica e la medicina. Infatti, Demis Hassabis (fondatore e CEO) e John Jumper ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

AI e ML per programmatori in PyTorch

AI e ML per programmatori in PyTorch

Laurence Moroney
Modelli linguistici di grandi dimensioni pratici

Modelli linguistici di grandi dimensioni pratici

Jay Alammar, Maarten Grootendorst
IA generativa pratica con trasformatori e modelli di diffusione

IA generativa pratica con trasformatori e modelli di diffusione

Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker
Modelli di progettazione dell'IA generativa

Modelli di progettazione dell'IA generativa

Valliappa Lakshmanan, Hannes Hapke

Publisher Resources

ISBN: 0642572270070Supplemental Content