
372
Chapitre 10. Apprentissage par renforcement
Comment les chercheurs de DeepMind sont-ils arrivés à ce résultat ? Avec le recul,
cela semble plutôt simple. Ils ont appliqué la puissance de l’apprentissage profond au
domaine de l’apprentissage par renforcement et cela a fonctionné au-delà de leurs
espérances.
Dans ce chapitre, nous commencerons par expliquer ce qu’est l’apprentissage par
renforcement et ses applications de prédilection. Nous présenterons ensuite deux des
techniques les plus importantes de l’apprentissage par renforcement profond, les gra-
dients de politique et les DQN (Deep Q-Networks), et nous expliquerons les processus
de décision ...