Kapitel 24: RL und diskrete Optimierung

Als Nächstes untersuchen wir ein neues Anwendungsgebiet des Reinforcement Learnings: diskrete Optimierungsaufgaben, die durch den berühmten Zauberwürfel (Rubik’s Cube) veranschaulicht werden.

Die Themen in diesem Kapitel:

  • Eine kurze Beschreibung der Grundlagen diskreter Optimierung

  • Eine schrittweise Betrachtung einer Arbeit mit dem Titel Solving the Rubik’s Cube Without Human Knowledge, die von einer Forschergruppe um Stephen McAleer 2018 veröffentlicht wurde (arXiv:1805.07470), in der es um die Anwendung von RL-Verfahren auf den Zauberwürfel geht (bei dem es sich um eine Optimierungsaufgabe handelt)

  • Von mir durchgeführte Experimente zum Reproduzieren der in der Arbeit vorgestellten Ergebnisse und zukünftige ...

Get Deep Reinforcement Learning -- Das umfassende Praxis-Handbuch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.