Skip to Main Content
Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch
book

Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch

by Maxim Lapan
June 2020
Intermediate to advanced content levelIntermediate to advanced
768 pages
22h 23m
German
mitp Verlag
Content preview from Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch

Kapitel 13: Asynchronous Advantage Actor Critic

Dieses Kapitel ist der Erweiterung des Actor-Critic-Verfahrens (A2C) gewidmet, das ich im letzten Kapitel ausführlich erörtert habe. Die Erweiterung ermöglicht echte asynchrone Interaktionen mit der Umgebung. Die vollständige Bezeichnung lautet Asynchronous Advantage Actor-Critic und wird üblicherweise als A3C abgekürzt. Es ist eins der von RL-Praktikern meistgenutzten Verfahren.

Wir werden nun zwei Ansätze betrachten, die dem einfachen A2C-Verfahren asynchrones Verhalten hinzufügen: Datenparallelität und Gradientenparallelität. Die beiden Verfahren weisen unterschiedliche Anforderungen und Eigenschaften auf und sind deshalb in unterschiedlichen Situationen anwendbar.

Die Themen in diesem Kapitel: ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Deep Learning Kochbuch

Deep Learning Kochbuch

Douwe Osinga

Publisher Resources

ISBN: 9783747500385Publisher WebsiteOtherSupplemental Content