Progetti di machine learning e scienza dei dati per la finanza
by Hariom Tatsat, Sahil Puri, Brad Lookabaugh
Capitolo 9. Apprendimento per rinforzo
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Gli incentivi guidano quasi tutto, e la finanza non fa eccezione. Gli esseri umani non imparano da milioni di esempi etichettati. Al contrario, spesso impariamo da esperienze positive o negative che associamo alle nostre azioni. L'apprendimento dalle esperienze e dalle relative ricompense o punizioni è l'idea alla base dell'apprendimento per rinforzo (RL).1
L'apprendimento per rinforzo è un approccio per addestrare una macchina a trovare il miglior corso d'azione attraverso politiche ottimali che massimizzano le ricompense e minimizzano le punizioni.
Gli algoritmi di RL che hanno permesso ad AlphaGo (il primo programma informatico a sconfiggere un giocatore umano professionista di Go) stanno facendo breccia anche nella finanza. L'idea principale dell'apprendimento rinforzato di massimizzare le ricompense si allinea perfettamente con diverse aree della finanza, tra cui il trading algoritmico e la gestione del portafoglio. L'apprendimento rinforzato è particolarmente adatto al trading algoritmico, perché il concetto di un agente che massimizza il rendimento in un ambiente incerto e dinamico ha molto in comune con un investitore o una strategia di trading che interagisce con i mercati finanziari. I modelli basati sull'apprendimento rinforzato fanno un passo avanti rispetto alle strategie di trading basate ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access