8章拡散モデル
8章の目標
- 拡散モデルを定義する基礎的な性質と要素について学ぶ。
- 順方向の拡散過程を使ってどのように画像の訓練セットにノイズを加えるか理解する。
- 再パラメータ化トリックと、それがなぜ重要なのかを理解する。
- 順方向拡散スケジューリングのいろいろな形を調べる。
- 逆方向の拡散過程が、ノイズを加えていく順方向の過程とどう関係しているのかを理解する。
- 逆方向の拡散過程をパラメータ化するのに使用するU-Netのアーキテクチャを調べる。
- Kerasを使って、花の画像を生成するノイズ除去拡散モデル(denoising diffusion model:DDM)を作成する。
- そのモデルから新しい花の画像をサンプリングする。
- 拡散ステップ数が画質にどのような効果を持つかを調べ、2つの画像を潜在空間内で補間する。
拡散モデルは、GANと並んで、ここ10年で紹介された最も影響力とインパクトのある画像生成モデリングのテクニックの1つです。拡散モデルは現在、多くのベンチマークで、以前の最先端のGANの性能をしのいでおり、生成モデリングを実際に使う人、特に画像処理関連の人たちの間で、急速に頼れる選択肢となってきています(例えば、テキストから画像を生成するOpenAIのDALL·E 2やGoogleのImageGenなど)。最近では、広範囲のタスクに対する拡散モデルの適用が爆発的に増えており、2017年から2020年に起こったGANの広がりを彷彿とさせます。
拡散モデルの基礎となる中心的な考え方の多くは、すでに本書で見てきた初期のタイプの生成モデル(例えば、ノイズ除去オートエンコーダやエネルギーベースモデル)と類似しています。実際、「拡散」という名前は、研究の進んでいる熱力学的拡散の特性からインスピレーションを得ています。この純粋な物理的分野とディープラーニングとの間の重要な結びつきが、2015年に生まれました ...
Get 生成 Deep Learning 第2版 ―絵を描き、物語や音楽を作り、ゲームをプレイする now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.