June 2020
Intermediate to advanced
768 pages
22h 23m
German
In diesem Kapitel werde ich damit fortfahren, modellbasierte Verfahren zu erörtern, und wir werden die Fälle untersuchen, in denen ein Umgebungsmodell verfügbar ist, die Umgebung allerdings von zwei rivalisierenden Parteien genutzt wird. Diese Situation ist typisch für Brettspiele, bei denen die Spielregeln feststehen und sämtliche Positionen der Spielsteine beobachtbar sind und wir es mit einem Gegenspieler zu tun haben, der uns daran hindern möchte, das Spiel zu gewinnen.
Kürzlich hat DeepMind einen sehr eleganten Ansatz zur Lösung solcher Aufgaben vorgestellt, bei dem keine weiteren Kenntnisse über das Spiel erforderlich sind, sondern der Agent seine Policy allein dadurch verbessert, dass er gegen sich selbst spielt. ...