Skip to Main Content
Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch
book

Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch

by Maxim Lapan
June 2020
Intermediate to advanced content levelIntermediate to advanced
768 pages
22h 23m
German
mitp Verlag
Content preview from Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch

Kapitel 11: Eine Alternative: Policy Gradients

In diesem ersten Kapitel des dritten Teils des Buchs werden wir uns mit Alternativen befassen, einen Markov-Entscheidungsprozess (Markov Decision Process, MDP) zu handhaben, die eine ganze Familie von Verfahren bilden: Policy Gradients (PG).

Die Themen in diesem Kapitel:

  • Wir verschaffen uns einen Überblick über die Verfahren und ich erörtere, weshalb sie verwendet werden und welche Stärken und Schwächen sie im Vergleich zum bereits vertrauten Q-Learning aufweisen.

  • Wir betrachten zunächst ein einfaches PG-Verfahren namens REINFORCE und werden versuchen, es auf die CartPole-Umgebung anzuwenden, um es mit dem DQN-Ansatz zu vergleichen.

11.1  Werte und Policy

Bevor wir uns eingehender mit PGs befassen, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Deep Learning Kochbuch

Deep Learning Kochbuch

Douwe Osinga

Publisher Resources

ISBN: 9783747500385Publisher WebsiteOtherSupplemental Content