Capitolo 2. Apprendimento Q profondo
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Come gli esseri umani, i nostri agenti imparano da soli a realizzare le strategie di successo che portano alle maggiori ricompense a lungo termine. Questo paradigma dell'apprendimento per tentativi ed errori, esclusivamente grazie a ricompense o punizioni, è noto come apprendimento per rinforzo (RL).1
DeepMind (2016)
Il capitolo precedente introduce il deep Q-learning (DQL) come un importante algoritmo di IA che apprende attraverso l'interazione con l'ambiente. Questo capitolo fornisce ulteriori dettagli sull'algoritmo DQL. Utilizza l'ambiente CartPole del pacchetto Gymnasium Python per illustrare l'interazione basata su API con gli ambienti di gioco. Inoltre, implementa un agente DQL come classe Python autonoma che funge da modello per i successivi agenti DQL applicati agli ambienti finanziari.
Tuttavia, prima di concentrarsi sul DQL, il capitolo discute i problemi decisionali generali in economia e finanza. La programmazione dinamica viene introdotta come meccanismo di soluzione per i problemi decisionali dinamici. Questo fornisce il background per l'applicazione degli algoritmi DQL, poiché si può ritenere che essi portino a soluzioni approssimate di problemi di programmazione dinamica.
Lasezione "Problemi decisionali" classifica i problemi decisionali in economia efinanza in base a diverse caratteristiche. ...