ステップ8拡散モデルの理論

ここまで私たちはVAEについて学びました。もちろん、それで満足するわけにはいきません。私たちはVAEを発展させ、さらに先へと進みます。具体的には、VAEの潜在変数を階層化した「階層型VAE」を導出します。そして、階層型VAEをさらに発展させる形で「拡散モデル」へと進みます。この流れが興味深く、美しくもあります。数式はやや込み入ったものになりますが、まずは全体の流れを把握することを目標にしましょう。その後で、時間をかけて数式に挑むことをおすすめします。

8.1　VAEから拡散モデルへ

本ステップで導出する「拡散モデル」は、正確には「Denoising Diffusion Probabilistic Models（DDPM）[11]」というモデルです。DDPMやそれに似たモデルは数多く提案されており、それらを総称して「拡散モデル」と呼びます。本書ではDDPMを指して、単に「拡散モデル」と呼ぶことにします。なお、Denoising Diffusion Probabilistic Modelsの各単語は次の意味があります。

Denoising（デノイジング）：ノイズの除去
Diffusion（拡散）：物質が均一に広がる現象
Probabilistic（確率的）：確率を用いた手法

この言葉の意味は本節を読み進めていくと理解できるでしょう。それではVAEの復習から始めます。

8.1.1　VAEの復習

もう一度、VAEについて振り返ります。VAEは潜在変数のあるモデルでした。データ生成は、潜在変数を固定の正規分布よりサンプリングし、潜在変数から観測変数への変換をニューラルネットワークで行います。そして、VAEではもうひとつ別のニューラルネットワークを使い、観測変数から潜在変数への変換を行います。このVAEの構成を図で表すと、 ...

Get ゼロから作るDeep Learning ❺ ―生成モデル編 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Start your free trial

ゼロから作るDeep Learning ❺ ―生成モデル編 by 斎藤康毅

ステップ8拡散モデルの理論

8.1　VAEから拡散モデルへ

8.1.1　VAEの復習

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly

ステップ8拡散モデルの理論

8.1 VAEから拡散モデルへ

8.1.1 VAEの復習

Don’t leave empty-handed

It’s yours, free.

Check it out now on O’Reilly

8.1　VAEから拡散モデルへ

8.1.1　VAEの復習