9章生成モデリングの未来

筆者は「8章プレイする」で説明した“World Models”の論文が発表されてすぐの2018年の3月に本書を書き始めました。その時点では、この論文が本書の核となる最終章の目玉になるようにしたいと思っていました。というのは、これが、生成モデルの手助けにより、エージェントが自分内部に持つ、自分がいる環境をモデル化した世界モデル内でより深い学習を行うことが可能になった、最初の実践的な例だったからです。現在でもなお、この研究はまったく驚くべきものです。エージェントが、ある環境での単一の報酬を最大化するだけではなく、自分自身でその環境の内部表現を生成し、自分自身で最適化すべき報酬を作り出す能力を持つことにより学習する、そんな未来を垣間見ることができるからです。この章では、このアイデアをたどっていくことで、それが私たちを連れて行ってくれる未来を見ていきましょう。

まず、生成モデリングという分野を見渡す景観の最先端、すなわち、この分野で最も急進的かつ革新的、そして一流のアイデアの中に、自分自身を置く必要があります。本書を書き始めて以降、GANの著しい進展とアテンションベースの方法論は、人間が生成したものと区別がつかないような画像、テキストや音楽を生成できるまでになりました。私たちは、このような進展をこれまで見てきた例に沿って構成し、今日利用可能な最先端のアーキテクチャを見ていくことから始めましょう。