book

生成式深度学习，第二版

Name: 生成式深度学习，第二版
Author: David Foster
ISBN: 9798341656703

by David Foster

May 2025

Intermediate to advanced

456 pages

5h 50m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
序言
目标和方法先决条件路线图第二版的变化其他资源本书使用的约定代码库使用代码示例O'Reilly 在线学习如何联系我们致谢
I.生成式深度学习简介
1.生成模型
什么是生成模型？生成式建模与判别式建模生成式建模的兴起生成模型和人工智能我们的第一个生成模型世界你好生成式建模框架表征学习核心概率论生成模型分类法生成式深度学习代码库克隆存储库使用 Docker在 GPU 上运行摘要
2.深度学习
深度学习数据深度神经网络什么是神经网络？学习高级功能TensorFlow 和 Keras多层感知器（MLP）准备数据建立模型编译模型训练模型评估模型卷积神经网络（CNN）卷积层批量标准化辍学建立 CNN培训和评估 CNN摘要
II.方法
3.变异自动编码器
导言自动编码器时尚-MNIST 数据集自动编码器架构编码器解码器连接编码器和解码器重建图像潜空间可视化生成新图像变异自动编码器编码器损失函数训练变异自动编码器变异自动编码器分析探索潜空间CelebA 数据集训练变异自动编码器变异自动编码器分析创造新面孔潜空间运算脸部变形摘要
4.生成式对抗网络
导言深度卷积广义运算（DCGAN）砖块数据集歧视者发电机培训 DCGAN对 DCGAN 的分析GAN 培训：技巧和窍门带梯度惩罚的 Wasserstein GAN（WGAN-GP）瓦瑟施泰因损失Lipschitz 约束执行 Lipschitz 约束梯度惩罚损失培训 WGAN-GP对 WGAN-GP 的分析有条件广域网（CGAN）CGAN 架构培训 CGAN分析 CGAN摘要
5.自回归模型
导言长短期记忆网络（LSTM）食谱数据集处理文本数据令牌化创建训练集LSTM 架构嵌入层LSTM 层LSTM 单元训练 LSTMLSTM 分析递归神经网络（RNN）扩展堆叠递归网络分门别类的经常性单位双向单元PixelCNN屏蔽卷积层残块训练 PixelCNN对 PixelCNN 的分析混合物分布摘要
6.流量模型标准化
导言流量正常化变量变化雅各布行列式变量变化方程RealNVP双月数据集耦合层训练 RealNVP 模型RealNVP 模型分析其他归一化流量模型发光FFJORD摘要

7.基于能量的模型
导言基于能量的模型MNIST 数据集能量功能利用郎之万动力学进行采样对比发散训练基于能量的模型分析其他能源模型摘要
8.扩散模型
导言去噪扩散模型（DDM）花朵数据集前向扩散过程重参数化技巧扩散时间表反向扩散过程U-Net 去噪模型训练扩散模型从去噪扩散模型中取样扩散模型分析摘要
III.应用
9.变压器
导言GPT葡萄酒评论数据集请注意查询、键和值多头关注因果掩蔽变压器模块位置编码培训 GPTGPT 分析其他变形金刚T5GPT-3 和 GPT-4ChatGPT摘要
10.高级伽马网络
导言ProGAN渐进式培训输出StyleGAN测绘网络合成网络StyleGAN 的输出StyleGAN2权重调制和解调路径长度正则化没有渐进式增长来自 StyleGAN2 的输出其他重要的全球网络自我关注网络（SAGAN）BigGANVQ-GANViT VQ-GAN摘要
11.音乐世代
导言音乐世代的变形金刚巴赫大提琴组曲数据集解析 MIDI 文件令牌化创建训练集正弦位置编码多个输入和输出音乐发生变压器分析复调音乐的标记化MuseGAN巴赫合唱曲数据集MuseGAN 生成器MuseGAN 评论家对 MuseGAN 的分析摘要
12.世界模型
导言强化学习赛车环境世界模式概览建筑学培训收集随机推广数据培训自愿专家虚拟学院架构探索虚拟学院收集数据以训练 MDN-RNN训练 MDN-RNNMDN-RNN 架构从 MDN-RNN 取样培训控制员控制器架构CMA-ES并行化 CMA-ES梦中培训摘要
13.多模式模型
导言DALL.E 2建筑学文本编码器剪辑优先权解码器来自 DALL.E 2 的示例图片建筑学绘图台Imagen 的例子稳定扩散建筑学稳定扩散实例火烈鸟建筑学视觉编码器接收器重采样器语言模式弗拉明戈的例子摘要
14.结论
生成式人工智能年表2014-2017:VAE 和 GAN 时代2018-2019：变形金刚时代2020-2022：大模型时代生成式人工智能的现状大型语言模型文本到代码模型文本到图像模型其他应用生成式人工智能的未来日常生活中的生成式人工智能工作场所中的生成式人工智能生成式人工智能在教育中的应用生成式人工智能伦理与挑战最终想法
索引
关于作者

Content preview from 生成式深度学习，第二版

第 1 章生成模型

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

本章是对生成式建模领域的一般性介绍。

我们将首先从理论上温和地介绍生成建模，并了解生成建模是如何与更广泛研究的判别建模自然对应的。然后，我们将建立一个框架，描述一个好的生成模型应具备的理想特性。我们还将阐述必须了解的核心概率概念，以便充分理解不同方法如何应对生成模型的挑战。

这将自然而然地引导我们进入倒数第二部分，该部分列出了当今该领域占主导地位的六大生成模型系列。最后一节将介绍如何开始使用本书附带的代码库。

什么是生成模型？

生成模型可大致定义如下：

生成模型是机器学习的一个分支，它涉及训练一个模型，以生成与给定数据集相似的新数据。

这在实践中意味着什么？假设，我们有一个包含马匹照片的数据集。我们可以在这个数据集上训练一个生成模型，以捕捉支配马匹图像中像素间复杂关系的规则。然后，我们可以从该模型中提取样本，创建出原始数据集中不存在的新颖、逼真的马匹图像。图 1-1 展示了这一过程。

为了建立一个生成模型，我们需要一个由我们试图生成的实体的许多示例组成的数据集。称为训练数据，其中一个数据点称为观测点。

每个观测结果都包含许多特征。对于图像生成问题，特征通常是单个像素值；对于文本生成问题，特征可能是单个单词或字母群。我们的目标是建立一个模型，它能生成新的特征集，这些特征集看起来就像使用与原始数据相同的规则创建的一样。从概念上讲，对于图像生成来说，这是一项非常困难的任务，因为单个像素值的分配方式非常多，而构成我们试图生成的实体图像的这种排列方式相对较少。

生成式模型还必须是概率性的，而不是确定性的，因为我们希望能够对输出的多种不同变化进行采样，而不是每次都得到相同的输出。如果我们的模型仅仅是一种固定的计算，比如取训练数据集中每个像素的平均值，那么它就不是生成式模型。生成模型必须包含随机成分，以影响模型生成的各个样本。

换句话说，我们可以想象存在某种未知的概率分布，它解释了为什么某些图像可能出现在训练数据集中，而另一些图像则不可能。我们的工作就是建立一个尽可能接近这种分布的模型，然后从中采样，生成新的、独特的观察结果，这些观察结果看起来就像是原始训练集中的观察结果。

生成模型与判别模型

为了真正理解生成式建模的目标以及其重要性，我们有必要将生成式建模与其对应的判别式建模进行比较。如果你学习过机器学习，那么你所面临的大多数问题都很可能是判别性的。为了理解两者的区别，让我们来看一个例子。

假设我们有一个画作数据集，其中一些是梵高画的，另一些是其他艺术家画的。有了足够的数据，我们就可以训练一个判别模型来预测某幅画是否出自凡高之手。我们的模型会发现，某些颜色、形状和纹理更有可能表明画作出自这位荷兰大师之手，对于具有这些特征的画作，模型会相应地提高预测权重。图 1-2显示了判别建模过程，请注意它与图 1-1 所示的生成建模过程有何不同。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341656703

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business