Skip to Content
Rayon d'apprentissage
book

Rayon d'apprentissage

by Max Pumperla, Edward Oakes, Richard Liaw
November 2024
Intermediate to advanced
274 pages
8h 29m
French
O'Reilly Media, Inc.
Book available
Content preview from Rayon d'apprentissage

Chapitre 4. Apprentissage par renforcement avec Ray RLlib

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Au chapitre 3, tu as construit un environnement RL, une simulation pour jouer à certains jeux, un algorithme RL et le code pour paralléliser l'apprentissage de l'algorithme, le tout entièrement à partir de zéro.C'est bien de savoir comment faire tout cela, mais en pratique, la seule chose que tu veux vraiment faire lors de l'apprentissage des algorithmes RL est la première partie, à savoir, spécifier ton environnement personnalisé, le "jeu" auquel tu veux jouer.1 La plupart de tes efforts iront à la sélection du bon algorithme, à sa configuration, à la recherche des meilleurs paramètres pour le problème et, de manière générale, à la concentration sur la formation d'une politique performante.

Ray RLlib est une bibliothèque de qualité industrielle permettant de construire des algorithmes RL à grande échelle.Tu as déjà vu un premier exemple de RLlib au chapitre 1, mais dans ce chapitre, nous allons aller beaucoup plus en profondeur.Ce qui est génial avec RLlib, c'est qu'il s'agit d'une bibliothèque mature pour les développeurs qui est livrée avec de bonnes abstractions avec lesquelles travailler.Comme tu le verras, beaucoup de ces abstractions, tu les connais déjà grâce au chapitre précédent.

Nous commençons par te donner un aperçu des capacités de RLlib, puis nous revisitons rapidement le jeu ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Ten Minute Guide to Lotus Notes® 4.6

Ten Minute Guide to Lotus Notes® 4.6

Dorothy Burke, Jane Calabria
What Employees Want Most in Uncertain Times

What Employees Want Most in Uncertain Times

Kristine W. Powers, Jessica B.B. Diaz

Publisher Resources

ISBN: 9798341619012Supplemental Content