ANNEXE B RL4J et apprentissage par renforcement
Ruben Fiszel (http://rubenfiszel.github.io/)
Préliminaires
Nous commençons cette annexe par une introduction à l’apprentissage par renforcement, suivie d’une explication détaillée sur les réseaux Q profonds (DQN) pour les entrées de pixels, puis nous conclurons en vous montrant un exemple en RL4J. Débutons par un tour d’horizon sur les concepts de base de l’apprentissage par renforcement.
L’apprentissage par renforcement est un domaine passionnant de l’apprentissage automatique. Il s’agit, fondamentalement, de l’apprentissage d’une stratégie efficace dans un environnement donné. Dans un sens, c’est très similaire au conditionnement pavlovien : vous attribuez une récompense pour un comportement donné ...
Get Deep learning en action now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.