June 2020
Intermediate to advanced
768 pages
22h 23m
German
Im letzten Kapitel haben Sie PyTorch kennengelernt. In diesem Kapitel werde ich den ersten Teil des Buchs zusammenfassen und wir werden uns mit einem der RL-Verfahren beschäftigen, dem Kreuzentropie-Verfahren.
Trotz der Tatsache, dass es nicht so bekannt ist wie andere Werkzeuge des RL-Praktikers, wie etwa Deep Q-Netze (DQN) oder das Advantage-Actor-Critic-Verfahren, besitzt das Kreuzentropie-Verfahren seine eigenen Stärken. Zum einen ist es wirklich einfach, deshalb ist es anschaulich und gut zu verstehen. Die Implementierung in PyTorch umfasst beispielsweise weniger als 100 Zeilen Code.
Zum anderen konvergiert es gut. In einfachen Umgebungen, in denen keine komplexe, aus mehreren Schritten bestehende ...