Chapitre 10. Remarques finales
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Le temps et l'incertitude sont les éléments centraux qui influencent le comportement économique financier. C'est la complexité de leur interaction qui constitue le défi intellectuel et l'excitation de l'étude de la finance. Pour analyser correctement les effets de cette interaction, il faut souvent des outils analytiques sophistiqués.
Merton (1990)
L'apprentissage par renforcement (RL) est sans aucun doute devenu un algorithme et une approche centrale et importante dans l'apprentissage automatique (ML) et l'IA en général. Il existe de nombreuses saveurs différentes de l'idée algorithmique de base, dont un aperçu peut être trouvé dans Sutton et Barto (2018). Ce livre se concentre principalement sur le deep learning (DQL). L'idée fondamentale de DQL est que l'agent apprend une politique d'action optimale qui attribue une valeur à chaque combinaison état-action réalisable. Plus la valeur est élevée, meilleure est l'action compte tenu d'un certain état. Le livre fournit également au chapitre 9 un exemple d'algorithme simple de critique d'acteur. Dans ce cas, l'agent dispose de la politique d'action optimale séparée de la fonction de valeur. Au cœur de ces algorithmes se trouvent des réseaux neuronaux profonds (DNN) qui sont utilisés pour approximer les politiques d'action optimales et, dans le cas des algorithmes ...