book

生成式深度学习，第二版

by David Foster

May 2025

Intermediate to advanced

456 pages

5h 50m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

目标和方法先决条件路线图第二版的变化其他资源本书使用的约定代码库使用代码示例O'Reilly 在线学习如何联系我们致谢
什么是生成模型？生成式建模与判别式建模生成式建模的兴起生成模型和人工智能我们的第一个生成模型世界你好生成式建模框架表征学习核心概率论生成模型分类法生成式深度学习代码库克隆存储库使用 Docker在 GPU 上运行摘要
深度学习数据深度神经网络什么是神经网络？学习高级功能TensorFlow 和 Keras多层感知器（MLP）准备数据建立模型编译模型训练模型评估模型卷积神经网络（CNN）卷积层批量标准化辍学建立 CNN培训和评估 CNN摘要
导言自动编码器时尚-MNIST 数据集自动编码器架构编码器解码器连接编码器和解码器重建图像潜空间可视化生成新图像变异自动编码器编码器损失函数训练变异自动编码器变异自动编码器分析探索潜空间CelebA 数据集训练变异自动编码器变异自动编码器分析创造新面孔潜空间运算脸部变形摘要
导言深度卷积广义运算（DCGAN）砖块数据集歧视者发电机培训 DCGAN对 DCGAN 的分析GAN 培训：技巧和窍门带梯度惩罚的 Wasserstein GAN（WGAN-GP）瓦瑟施泰因损失Lipschitz 约束执行 Lipschitz 约束梯度惩罚损失培训 WGAN-GP对 WGAN-GP 的分析有条件广域网（CGAN）CGAN 架构培训 CGAN分析 CGAN摘要
导言长短期记忆网络（LSTM）食谱数据集处理文本数据令牌化创建训练集LSTM 架构嵌入层LSTM 层LSTM 单元训练 LSTMLSTM 分析递归神经网络（RNN）扩展堆叠递归网络分门别类的经常性单位双向单元PixelCNN屏蔽卷积层残块训练 PixelCNN对 PixelCNN 的分析混合物分布摘要
导言流量正常化变量变化雅各布行列式变量变化方程RealNVP双月数据集耦合层训练 RealNVP 模型RealNVP 模型分析其他归一化流量模型发光FFJORD摘要

导言基于能量的模型MNIST 数据集能量功能利用郎之万动力学进行采样对比发散训练基于能量的模型分析其他能源模型摘要
导言去噪扩散模型（DDM）花朵数据集前向扩散过程重参数化技巧扩散时间表反向扩散过程U-Net 去噪模型训练扩散模型从去噪扩散模型中取样扩散模型分析摘要
导言GPT葡萄酒评论数据集请注意查询、键和值多头关注因果掩蔽变压器模块位置编码培训 GPTGPT 分析其他变形金刚T5GPT-3 和 GPT-4ChatGPT摘要
导言ProGAN渐进式培训输出StyleGAN测绘网络合成网络StyleGAN 的输出StyleGAN2权重调制和解调路径长度正则化没有渐进式增长来自 StyleGAN2 的输出其他重要的全球网络自我关注网络（SAGAN）BigGANVQ-GANViT VQ-GAN摘要
导言音乐世代的变形金刚巴赫大提琴组曲数据集解析 MIDI 文件令牌化创建训练集正弦位置编码多个输入和输出音乐发生变压器分析复调音乐的标记化MuseGAN巴赫合唱曲数据集MuseGAN 生成器MuseGAN 评论家对 MuseGAN 的分析摘要
导言强化学习赛车环境世界模式概览建筑学培训收集随机推广数据培训自愿专家虚拟学院架构探索虚拟学院收集数据以训练 MDN-RNN训练 MDN-RNNMDN-RNN 架构从 MDN-RNN 取样培训控制员控制器架构CMA-ES并行化 CMA-ES梦中培训摘要
导言DALL.E 2建筑学文本编码器剪辑优先权解码器来自 DALL.E 2 的示例图片建筑学绘图台Imagen 的例子稳定扩散建筑学稳定扩散实例火烈鸟建筑学视觉编码器接收器重采样器语言模式弗拉明戈的例子摘要
生成式人工智能年表2014-2017:VAE 和 GAN 时代2018-2019：变形金刚时代2020-2022：大模型时代生成式人工智能的现状大型语言模型文本到代码模型文本到图像模型其他应用生成式人工智能的未来日常生活中的生成式人工智能工作场所中的生成式人工智能生成式人工智能在教育中的应用生成式人工智能伦理与挑战最终想法

Content preview from 生成式深度学习，第二版

第 2 章深度学习深度学习

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

让我们从深度学习的基本定义开始：

Deep Learning 是一类机器学习算法，它使用多层堆叠的处理单元，从非结构化数据中学习高层表征。

要全面理解 Deep Learning，我们需要对这一定义深入研究一番。首先，我们来看看深度学习可用于建模的不同类型的非结构化数据，然后深入了解构建多层堆叠处理单元以解决分类任务的机制。这将为我们今后重点介绍深度学习用于生成任务的章节打下基础。

深度学习数据

许多类型的机器学习算法都需要结构化的表格数据作为输入，这些数据被排列成描述每个观察结果的特征列。例如，一个人的年龄、收入和上个月访问网站的次数都是有助于预测此人下个月是否会订阅特定在线服务的特征。我们可以使用这些特征的结构化表格来训练逻辑回归、随机森林或 XGBoost 模型，以预测二元响应变量--该人是否订阅（1）或不订阅（0）？在这里，每个单独的特征都包含有关观察结果的信息，模型将学习这些特征如何相互作用来影响响应。

非结构化数据是指没有自然排列成特征列的任何数据，如图像、音频和文本。当然，图像有空间结构，录音或文字段落有时间结构，视频数据既有空间结构也有时间结构，但由于数据没有按特征列排列，因此被视为非结构化数据，如图 2-1 所示。

当我们的数据是非结构化数据时，单个像素、频率或字符几乎完全不能提供信息。例如，知道图像的 234 像素是浑浊的棕色，并不能真正帮助识别图像是房子还是狗；知道句子的 24 字符是e，并不能帮助预测文本是关于足球还是政治。

像素或字符实际上只是画布上的凹陷，其中嵌入了更高层次的信息特征，如烟囱图像或前锋一词。如果把图像中的烟囱放在房子的另一侧，图像中仍然会有一个烟囱，但这一信息现在将由完全不同的像素来承载。如果 "前锋"一词在文本中出现的时间稍早或稍晚，文本仍然是关于足球的，但不同的字符位置会提供这一信息。数据的粒度加上高度的空间依赖性，破坏了像素或字符本身作为信息特征的概念。

因此，如果我们用原始像素值来训练逻辑回归模型、随机森林模型或 XGBoost 模型，除了最简单的分类任务外，训练出来的模型往往表现不佳。这些模型依赖于输入特征的信息量，而非空间依赖性。而 Deep Learning 模型则可以直接从非结构化数据中自行学习如何构建高级信息特征。

Deep Learning 可以应用于结构化数据，但其真正的威力，尤其是在生成建模方面，来自于它处理非结构化数据的能力。大多数情况下，我们希望生成新图像或原始文本串等非结构化数据，这就是为什么深度学习对生成建模领域产生了如此深远的影响。

深度神经网络

大部分深度学习系统都是具有多个堆叠隐藏层的人工神经网络（ANN，简称神经网络）。因此，深度学习现在几乎成了深度神经网络的代名词。不过，任何采用多层来学习输入数据高层表征的系统也是深度学习的一种形式（如深度信念网络）。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341656703Supplemental Content

生成式深度学习，第二版

by David Foster

第 2 章深度学习深度学习

深度学习数据

图 2-1. 结构化数据与非结构化数据的区别

深度神经网络

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

产品路线图全面升级

机器学习的训练数据

变压器在自然语言处理中的应用（修订版）

为深度学习编程 PyTorch

Publisher Resources

第 2 章 深度学习 深度学习

深度学习数据

图 2-1. 结构化数据与非结构化数据的区别

深度神经网络

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

产品路线图全面升级

机器学习的训练数据

变压器在自然语言处理中的应用（修订版）

为深度学习编程 PyTorch

Publisher Resources

第 2 章深度学习深度学习

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.