June 2020
Intermediate to advanced
768 pages
22h 23m
German
In diesem Kapitel wechseln wir ein weiteres Mal die Perspektive auf das Training beim Reinforcement Learning (RL) und werden uns mit zwei sogenannten Blackbox-Optimierungen befassen:
Evolutionsstrategien
Genetische Algorithmen
Diese Verfahren sind schon mindestens ein Jahrzehnt alt, aber in jüngster Zeit wurden Studien durchgeführt, die gezeigt haben, dass sie sich auf umfangreiche RL-Aufgaben anwenden lassen und dass sie der Wertiteration und den Policy-Gradienten-Verfahren ebenbürtig sind.
Zunächst einmal erörtere ich die gesamte Gruppe von Verfahren und wie sie sich von dem unterscheiden, was Sie bislang kennengelernt haben. Blackbox-Optimierungsverfahren ...