Chapitre 4. Apprentissage par renforcement avec Ray RLlib
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Au chapitre 3, tu as construit un environnement RL, une simulation pour jouer à certains jeux, un algorithme RL et le code pour paralléliser l'apprentissage de l'algorithme, le tout entièrement à partir de zéro.C'est bien de savoir comment faire tout cela, mais en pratique, la seule chose que tu veux vraiment faire lors de l'apprentissage des algorithmes RL est la première partie, à savoir, spécifier ton environnement personnalisé, le "jeu" auquel tu veux jouer.1 La plupart de tes efforts iront à la sélection du bon algorithme, à sa configuration, à la recherche des meilleurs paramètres pour le problème et, de manière générale, à la concentration sur la formation d'une politique performante.
Ray RLlib est une bibliothèque de qualité industrielle permettant de construire des algorithmes RL à grande échelle.Tu as déjà vu un premier exemple de RLlib au chapitre 1, mais dans ce chapitre, nous allons aller beaucoup plus en profondeur.Ce qui est génial avec RLlib, c'est qu'il s'agit d'une bibliothèque mature pour les développeurs qui est livrée avec de bonnes abstractions avec lesquelles travailler.Comme tu le verras, beaucoup de ces abstractions, tu les connais déjà grâce au chapitre précédent.
Nous commençons par te donner un aperçu des capacités de RLlib, puis nous revisitons rapidement le jeu ...