Kapitel 24: RL und diskrete Optimierung
Als Nächstes untersuchen wir ein neues Anwendungsgebiet des Reinforcement Learnings: diskrete Optimierungsaufgaben, die durch den berühmten Zauberwürfel (Rubik’s Cube) veranschaulicht werden.
Die Themen in diesem Kapitel:
Eine kurze Beschreibung der Grundlagen diskreter Optimierung
Eine schrittweise Betrachtung einer Arbeit mit dem Titel Solving the Rubik’s Cube Without Human Knowledge, die von einer Forschergruppe um Stephen McAleer 2018 veröffentlicht wurde (arXiv:1805.07470), in der es um die Anwendung von RL-Verfahren auf den Zauberwürfel geht (bei dem es sich um eine Optimierungsaufgabe handelt)
Von mir durchgeführte Experimente zum Reproduzieren der in der Arbeit vorgestellten Ergebnisse und zukünftige ...
Get Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.