CHAPITRE 12 Modèles du monde
Objectifs du chapitre :
• Découvrir les bases de l’apprentissage par renforcement.
• Comprendre comment la modélisation générative peut être utilisée au sein d’un modèle du monde dans une approche d’apprentissage par renforcement.
• Voir comment entraîner un autoencodeur variationnel (VAE) pour capturer les observations de l’environnement dans un espace latent de faible dimension.
• Parcourir le processus d’entraînement d’un réseau de neurones récurrent à densité de mélange (MDN-RNN) qui prédit la variable latente.
• Utiliser la stratégie d’évolution avec adaptation de la matrice de covariance (CMA-ES) pour entraîner un contrôleur capable de prendre des mesures intelligentes dans l’environnement.
• Comprendre comment ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access