Kapitel 9: Beschleunigung von RL-Verfahren
In Kapitel 8, DQN-Erweiterungen, haben Sie eine Reihe praktischer Tricks kennengelernt, die DQN-Verfahren stabilisieren und für schnellere Konvergenz sorgen. Dabei handelte es sich um Modifizierungen des einfachen DQN-Verfahrens (wie das Hinzufügen von Rauschen oder die Anwendung der Bellman-Gleichung), die zu einer besseren Policy führen und die für das Training erforderliche Zeit verkürzen. Es gibt jedoch eine weitere Möglichkeit: die Optimierung der Implementierung der Verfahren zur Verbesserung der Geschwindigkeit des Trainings. Das ist zwar ein rein technischer Ansatz, in der Praxis aber von großer Bedeutung.
In diesem Kapitel geht es um folgende Themen:
Wir versuchen, die Pong-Umgebung aus Kapitel 8 ...
Get Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.