9章生成モデリングの未来
筆者は「8章 プレイする」で説明した“World Models”の論文が発表されてすぐの2018年の3月に本書を書き始めました。その時点では、この論文が本書の核となる最終章の目玉になるようにしたいと思っていました。というのは、これが、生成モデルの手助けにより、エージェントが自分内部に持つ、自分がいる環境をモデル化した世界モデル内でより深い学習を行うことが可能になった、最初の実践的な例だったからです。現在でもなお、この研究はまったく驚くべきものです。エージェントが、ある環境での単一の報酬を最大化するだけではなく、自分自身でその環境の内部表現を生成し、自分自身で最適化すべき報酬を作り出す能力を持つことにより学習する、そんな未来を垣間見ることができるからです。この章では、このアイデアをたどっていくことで、それが私たちを連れて行ってくれる未来を見ていきましょう。
まず、生成モデリングという分野を見渡す景観の最先端、すなわち、この分野で最も急進的かつ革新的、そして一流のアイデアの中に、自分自身を置く必要があります。本書を書き始めて以降、GANの著しい進展とアテンションベースの方法論は、人間が生成したものと区別がつかないような画像、テキストや音楽を生成できるまでになりました。私たちは、このような進展をこれまで見てきた例に沿って構成し、今日利用可能な最先端のアーキテクチャを見ていくことから始めましょう。
9.1 5年間の進展
現在の形での生成モデリングの歴史は、より幅広く研究されている識別モデリングに比べて短いものです。おそらく、2014年のGANの発明がその歴史の始まりと考えられます。図9-1は生成モデリングにおける主要な研究開発をまとめたものです。その多くは、本書で説明しました。 ...
Get 生成 Deep Learning ―絵を描き、物語や音楽を作り、ゲームをプレイする now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.