CHAPITRE 12 Modèles du monde

Objectifs du chapitre :

Découvrir les bases de l’apprentissage par renforcement.

Comprendre comment la modélisation générative peut être utilisée au sein d’un modèle du monde dans une approche d’apprentissage par renforcement.

Voir comment entraîner un autoencodeur variationnel (VAE) pour capturer les observations de l’environnement dans un espace latent de faible dimension.

Parcourir le processus d’entraînement d’un réseau de neurones récurrent à densité de mélange (MDN-RNN) qui prédit la variable latente.

Utiliser la stratégie d’évolution avec adaptation de la matrice de covariance (CMA-ES) pour entraîner un contrôleur capable de prendre des mesures intelligentes dans l’environnement.

Comprendre comment ...

Get Deep learning génératif now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.