book

Rayon d'apprentissage

by Max Pumperla, Edward Oakes, Richard Liaw

November 2024

Intermediate to advanced

274 pages

8h 29m

French

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Qui devrait lire ce livre ?Objectifs de ce livreNaviguer dans ce livreComment utiliser les exemples de codeConventions utilisées dans ce livreUtiliser des exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciements
Qu'est-ce que Ray ?Qu'est-ce qui a mené à Ray ?Les principes de conception de RayTrois couches : Le noyau, les bibliothèques et l'écosystèmeUn cadre informatique distribuéUne suite de bibliothèques pour la science des donnéesRay AIR et le flux de travail de la science des donnéesTraitement des données avec des ensembles de données Ray.Modèle de formationRéglage des hyperparamètresModèle ServirUn écosystème en pleine croissanceRésumé
Une introduction à Ray CoreUn premier exemple d'utilisation de l'API RayUne vue d'ensemble de l'API du noyau RayComprendre les composants du système RayPlanifier et exécuter le travail sur un noeudLe nœud principalProgrammation et exécution distribuéesUn exemple simple de MapReduce avec RayCartographier et mélanger les données des documentsRéduire le nombre de motsRésumé
Présentation de l'apprentissage par renforcementMise en place d'un problème de labyrinthe simpleConstruire une simulationFormer un modèle d'apprentissage par renforcementConstruire une application Ray distribuéeRécapitulation de la terminologie de la LRRésumé
Un aperçu de RLlibDémarrer avec RLlibCréer un environnement de gymnastiqueExécuter l'interface de programmation de RLlibUtilisation de l'API Python RLlibConfiguration des expériences RLlibConfiguration des ressourcesConfiguration de l'opérateur de déploiementConfiguration de l'environnementTravailler avec les environnements RLlibUn aperçu des environnements RLlibTravailler avec plusieurs agentsTravailler avec des serveurs et des clients de politiquesConcepts avancésConstruire un environnement avancéAppliquer l'apprentissage du curriculumTravailler avec des données hors ligneAutres sujets avancésRésumé
Réglage des hyperparamètresConstruire un exemple de recherche aléatoire avec RayPourquoi l'OPS est-il difficile ?Une introduction à la musiqueComment fonctionne Tune ?Configuration et exécution de TuneApprentissage automatique avec TuneUtiliser RLlib avec TuneOptimiser les modèles KerasRésumé
Jeux de données RayNotions sur les ensembles de données RayCalcul sur des ensembles de données RayPipelines de donnéesExemple : Formation de copies d'un classificateur en parallèleIntégrations de bibliothèques externesConstruire un pipeline de MLRésumé
Les bases de la formation aux modèles distribuésIntroduction à Ray Train par l'exemplePrédire les gros pourboires dans les courses de taxi à New YorkChargement, prétraitement et naturalisationDéfinir un modèle de Deep LearningFormation distribuée avec Ray TrainInférence distribuée par lotsEn savoir plus sur les formateurs dans Ray TrainMigrer vers Ray Train avec un minimum de modifications du codeLes formateurs à l'échellePrétraitement avec Ray TrainIntégrer les formateurs avec Ray TuneUtiliser les rappels pour surveiller la formationRésumé
Caractéristiques principales de l'inférence en ligneLes modèles de ML sont gourmands en ressources informatiquesLes modèles de ML ne sont pas utiles isolémentUne introduction à Ray ServeVue d'ensemble de l'architectureDéfinition d'un point d'accès HTTP de baseMise à l'échelle et allocation des ressourcesDemande de mise en lotsGraphes d'inférence multimodèlesExemple de bout en bout : Construire une API alimentée par le NLPRecherche de contenu et prétraitementModèles de PNLTraitement HTTP et logique du piloteAssembler le toutRésumé

Création manuelle d'un cluster de RayDéploiement sur KubernetesMise en place de ton premier cluster KubeRayInteragir avec la grappe KubeRayExposer KubeRayConfiguration de KubeRayConfiguration de la journalisation pour KubeRayUtilisation du lanceur de grappes RayConfiguration de ton cluster RayUtilisation de l'interface de commande du lanceur de grappesInteragir avec un amas de rayonsTravailler avec des clusters de cloudsAWSUtilisation d'autres fournisseurs de services CloudMise à l'échelle automatiqueRésumé
Pourquoi utiliser AIR ?Concepts clés de la RIA à l'aide d'exemplesJeux de données et préprocesseurs RayLes formateursRéglages et points de contrôlePrédicteurs de lotsDéploiementsLes charges de travail qui conviennent à AIRExécution de la charge de travail AIRGestion de la mémoire AIRModèle d'échec de l'AIRMise à l'échelle automatique des charges de travail AIRRésumé
Un écosystème en pleine croissanceChargement et traitement des donnéesModèle de formationModèle ServirConstruire des intégrations personnaliséesUn aperçu des intégrations de RayRay et autres systèmesCadres de travail Python distribuésRay AIR et l'écosystème ML élargiComment intégrer AIR à ta plateforme de MLQue faire maintenant ?Résumé

Content preview from Rayon d'apprentissage

Chapitre 4. Apprentissage par renforcement avec Ray RLlib

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Au chapitre 3, tu as construit un environnement RL, une simulation pour jouer à certains jeux, un algorithme RL et le code pour paralléliser l'apprentissage de l'algorithme, le tout entièrement à partir de zéro.C'est bien de savoir comment faire tout cela, mais en pratique, la seule chose que tu veux vraiment faire lors de l'apprentissage des algorithmes RL est la première partie, à savoir, spécifier ton environnement personnalisé, le "jeu" auquel tu veux jouer.¹ La plupart de tes efforts iront à la sélection du bon algorithme, à sa configuration, à la recherche des meilleurs paramètres pour le problème et, de manière générale, à la concentration sur la formation d'une politique performante.

Ray RLlib est une bibliothèque de qualité industrielle permettant de construire des algorithmes RL à grande échelle.Tu as déjà vu un premier exemple de RLlib au chapitre 1, mais dans ce chapitre, nous allons aller beaucoup plus en profondeur.Ce qui est génial avec RLlib, c'est qu'il s'agit d'une bibliothèque mature pour les développeurs qui est livrée avec de bonnes abstractions avec lesquelles travailler.Comme tu le verras, beaucoup de ces abstractions, tu les connais déjà grâce au chapitre précédent.

Nous commençons par te donner un aperçu des capacités de RLlib, puis nous revisitons rapidement le jeu ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341619012Supplemental Content

Rayon d'apprentissage

by Max Pumperla, Edward Oakes, Richard Liaw

Chapitre 4. Apprentissage par renforcement avec Ray RLlib

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Ten Minute Guide to Lotus Notes® 4.6

What Employees Want Most in Uncertain Times

How to Be a Power Connector: The 5+50+100 Rule for Turning Your Business Network into Profits

LTE – The UMTS Long Term Evolution From Theory to Practice, Second Edition

Publisher Resources

Chapitre 4. Apprentissage par renforcement avec Ray RLlib

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Ten Minute Guide to Lotus Notes® 4.6

What Employees Want Most in Uncertain Times

How to Be a Power Connector: The 5+50+100 Rule for Turning Your Business Network into Profits

LTE – The UMTS Long Term Evolution From Theory to Practice, Second Edition

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.