May 2025
Intermediate to advanced
456 pages
5h 50m
Chinese
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
与 GANs 一样,扩散模型 也是过去十年中用于图像生成 的最具影响力和冲击力的生成建模技术之一。在许多基准测试中,扩散模型的表现都优于以前最先进的 GAN,并迅速成为生成建模从业者的首选,尤其是在视觉领域(例如,OpenAI 的 DALL.E 2 和谷歌的 ImageGen 用于文本到图像的生成)。最近,扩散模型在各种任务中的应用呈爆炸式增长,这不禁让人想起 2017-2020 年间 GAN 的激增。
支撑扩散模型的许多核心思想与我们在本书中已经探讨过的早期类型的生成模型(如去噪自动编码器、基于能量的模型)有相似之处。事实上,扩散这个名称的灵感来自于 热力学扩散这一研究得很透彻的特性:2015 年,这一纯物理领域与深度学习之间建立了重要联系。1
基于分数的生成模型领域也取得了重要进展、2,3这是基于能量建模的一个分支,直接估计对数分布的梯度(也称为分数函数)来训练模型,以替代使用对比发散法。其中,杨松和斯特凡诺-埃尔蒙采用了对原始数据进行多尺度噪声扰动的方法,以确保模型--噪声条件得分网络(NCSN)--在数据密度较低的区域表现良好。
这篇突破性的扩散模型论文发表于 2020 年夏天。4作者利用这一事实,训练出了一种能在多个数据集上与 GAN 相媲美的扩散模型,称为去噪扩散概率模型(DDPM)。
本章将介绍了解去噪扩散模型工作原理的理论要求。然后,您将学习如何使用 Keras 构建自己的去噪扩散模型。
为了帮助解释作为扩散模型基础的关键思想 ,让我们从一个小故事开始!