June 2020
Intermediate to advanced
768 pages
22h 23m
German
Als Nächstes untersuchen wir ein neues Anwendungsgebiet des Reinforcement Learnings: diskrete Optimierungsaufgaben, die durch den berühmten Zauberwürfel (Rubik’s Cube) veranschaulicht werden.
Die Themen in diesem Kapitel:
Eine kurze Beschreibung der Grundlagen diskreter Optimierung
Eine schrittweise Betrachtung einer Arbeit mit dem Titel Solving the Rubik’s Cube Without Human Knowledge, die von einer Forschergruppe um Stephen McAleer 2018 veröffentlicht wurde (arXiv:1805.07470), in der es um die Anwendung von RL-Verfahren auf den Zauberwürfel geht (bei dem es sich um eine Optimierungsaufgabe handelt)
Von mir durchgeführte Experimente zum Reproduzieren der in der Arbeit vorgestellten Ergebnisse und zukünftige ...