Skip to Content
生成式深度学习,第二版
book

生成式深度学习,第二版

by David Foster
May 2025
Intermediate to advanced
456 pages
5h 50m
Chinese
O'Reilly Media, Inc.
Book available
Content preview from 生成式深度学习,第二版

第 7 章 基于能量的模型 基于能量的模型

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

基于能量的模型 是一类广泛的生成模型,它借鉴了物理系统建模的一个关键理念--即事件发生的概率可以用波尔兹曼分布来表示,波尔兹曼分布是一个特定的函数,它将实值能量函数归一化为 0 和 1 之间的值。波尔兹曼分布最初是由路德维希-波尔兹曼于 1868 年提出的,他用波尔兹曼分布来描述热平衡状态下的气体。

在本章中,我们将了解如何利用这一理念来训练一个生成模型,并将其用于生成手写数字图像。我们将探索几个新概念,包括用于训练 EBM 的对比发散和用于采样的朗格文动力学。

导言

我们 将从一个小故事开始,说明基于能量的模型背后的关键概念。

Diane Mixx 和 Long-au-Vin 跑步俱乐部的故事捕捉到了基于能量的建模背后的关键思想。现在,让我们在使用 Keras 实现一个实际示例之前,更详细地探讨一下该理论。

基于能量的模型

基于能量的模型 试图用波尔兹曼分布来模拟真实的数据生成分布(公式 7-1),其中 E ( x ) 称为 观测数据的能量函数(或分数 x .

公式 7-1. 玻尔兹曼分布
p ( 𝐱 ) = e -E(𝐱) 𝐱 ^𝐗 e -E(𝐱 ^)

实际上,这相当于训练一个神经网络 E ( x )

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

产品路线图全面升级

产品路线图全面升级

C. Todd Lombardo, Bruce McCarthy, Evan Ryan, Michael Connors
变压器在自然语言处理中的应用(修订版)

变压器在自然语言处理中的应用(修订版)

Lewis Tunstall, Leandro von Werra, Thomas Wolf

Publisher Resources

ISBN: 9798341656703Supplemental Content