book

从零开始学习深度学习

by Seth Weidman

May 2025

Beginner to intermediate

252 pages

3h 16m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

理解神经网络需要多种心理模型章节大纲本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
功能数学图表代码衍生产品数学图表代码嵌套函数图表数学代码另一张图表连锁规则数学代码一个稍长的例子数学图表代码多输入功能数学图表代码多输入函数的导数图表数学代码多矢量输入函数数学从现有功能创建新功能数学图表代码多向量输入函数的导数图表数学代码矢量函数及其导数：更进一步图表数学代码矢量函数及其导数后向传递有两个二维矩阵输入的计算图数学图表代码有趣的部分向后传球图表数学代码结论
监督学习概述监督学习模型线性回归线性回归：图解线性回归：更有用的图表（和数学知识）添加截距线性回归：代码训练模型计算梯度示意图计算梯度：数学（和一些代码）计算梯度完整）代码使用这些梯度来训练模型评估我们的模型：训练集与测试集评估我们的模式：守则分析最重要的特征从零开始的神经网络步骤 1：一系列线性回归步骤 2：非线性函数步骤 3：另一次线性回归图表代码神经网络：后向传递训练和评估我们的第一个神经网络出现这种情况的两个原因结论
深度学习的定义：初体验神经网络的构件：操作图表代码神经网络的构件：层图表积木上的积木图层蓝图致密层神经网络类，也许还有其他类图表代码损失等级从零开始的 Deep Learning实施批量培训神经网络代码培训师和优化师优化器训练员把所有东西放在一起我们的首个 Deep Learning 模型（从零开始）结论和下一步措施
关于神经网络的一些直觉Softmax 交叉熵损失函数组件 1：软最大函数组成部分 2：交叉熵损失关于激活功能的说明实验数据预处理模型实验Softmax 交叉熵损失动力动力直觉在优化器类中实现动量实验随机梯度下降与动量学习率衰减学习率衰减的类型实验：学习率衰减重量初始化数学与代码实验：权重初始化辍学定义实施情况实验：辍学结论
神经网络和表征学习图像数据的不同架构卷积操作多通道卷积操作卷积层实施影响卷积层与全连接层的区别利用卷积层进行预测扁平层汇集层执行多通道卷积操作前传卷曲：后退通道批处理、二维卷积和多通道二维卷积最后的元素添加 "通道使用该操作训练 CNN压平操作完整的 Conv2D 层实验结论
关键限制：处理分支自动区分梯度累积编码建立递归神经网络的动机递归神经网络简介RNN 第一课RNNLayerRNN 的第二课堂RNNN 节点将这两门课结合起来后退通道RNNs：代码RNNLayer 类RNN 节点的基本要素"香草 "RNN 节点普通 "RNN 节点的局限性一个解决方案GRUNodesLSTMNodes基于字符级 RNN 语言模型的数据表示方法其他语言建模任务组合 RNNLayer 变体将这一切融为一体结论
PyTorch 张量器使用 PyTorch 进行深度学习PyTorch 元素：模型、层、优化器和损耗使用 PyTorch 实现神经网络构建模块：密集层示例：PyTorch 中的波士顿房价模型PyTorch 元素：优化器和损耗PyTorch 元素：训练器在 PyTorch 中优化学习的技巧PyTorch 中的卷积神经网络数据加载器和变换PyTorch 中的 LSTM后记通过自动编码器进行无监督学习表征学习处理无标签情况的方法在 PyTorch 中实现自动编码器无监督学习的更大考验和解决方案结论
矩阵链规则相对于偏差项的损失梯度通过矩阵乘法进行卷积

Content preview from 从零开始学习深度学习

第 3 章从零开始的深度学习从零开始的深度学习

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

你可能没有意识到，但你现在已经具备了回答我在本书开头提出的有关 Deep Learning 模型的关键问题的所有数学和概念基础：你理解了神经网络是如何工作的--矩阵乘法、损失以及与该损失相关的偏导数所涉及的计算--以及这些计算工作的原因（即微积分中的链式法则）。我们从第一原理出发构建神经网络，将其表示为一系列 "积木"，其中每个积木都是一个数学函数，从而实现了这种理解。在本章中，你将学会把这些积木本身表示为抽象的 Python 类，然后使用这些类来构建深度学习模型；在本章结束时，你将确实完成 "从零开始的深度学习"！

我们还将把这些构件对神经网络的描述映射到你以前可能听说过的对深度学习模型的更常规的描述。例如，在本章结束时，你就会知道深度学习模型拥有 "多个隐藏层 "意味着什么。这其实就是理解概念的精髓：能够在高层次描述和实际发生的低层次细节之间进行转换。让我们开始构建这种转换。到目前为止，我们只是从低层次操作的角度来描述模型。在本章的第一部分，我们将把对模型的描述映射到诸如 "层 "之类的常用高层概念，这些概念最终将使我们能够更轻松地描述更复杂的模型。

深度学习的定义：初体验

什么是"深度学习 "模型？在上一章中，我们将模型定义为由计算图表示的数学函数。这种模型的目的是尝试将输入（每个输入都来自具有共同特征的数据集，例如代表房屋不同特征的独立输入）映射到来自相关分布的输出（例如这些房屋的价格）。我们发现，如果我们将模型定义为一个函数，将参数作为其某些运算的输入，我们就可以通过以下程序"拟合 "模型，以最佳方式描述数据：

在 "前向传递 "过程中，通过模型重复输入观测数据，并跟踪沿途计算的数量。
计算损失，表示我们的模型预测与预期输出或目标的偏差程度。
利用前向传递计算出的数量和第 1 章中的链式计算法则，计算出每个输入参数最终对这一损失的影响程度。
更新参数值，以便下一组观测数据通过模型时，损失有望减少。

一开始，我们使用的模型仅包含一系列将特征转换为目标的线性运算（结果相当于传统的线性回归模型）。这样做有一个预期的局限性，那就是即使 "最优 "拟合，模型也只能表示特征与目标之间的线性关系。

然后，我们定义了一个函数结构，首先应用这些线性运算，然后应用一个非线性运算（sigmoid 函数），最后再应用一组线性运算。我们证明，通过这种修改，我们的模型可以学习到更接近输入和输出之间真实的非线性关系，同时还能学习到输入特征组合和目标之间的关系。

像这样的模型与 Deep Learning 模型之间有什么联系呢？我们先来尝试下一个有些笨拙的定义：深度学习模型是由至少有两个、非连续的非线性函数参与的一系列操作来表示的。

我很快就会说明这个定义的来源，但首先要注意的是，既然 Deep Learning 模型只是一系列运算，那么训练它们的过程其实与我们已经见过的较简单模型的训练过程是相同的。毕竟，让这个训练过程发挥作用的是模型相对于其输入的可微性；正如第 1 章中提到的，可微函数的组成是可微的，因此只要组成函数的各个运算是可微的，那么整个函数也将是可微的，我们就可以使用刚才描述的相同的四步训练过程来训练它。

然而，迄今为止，我们实际训练这些模型的方法一直是通过手动编码前向和后向传递来计算这些导数，然后将适当的量相乘来得到导数。对于第 2 章中的简单神经网络模型，这需要 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341657755Supplemental Content

从零开始学习深度学习

by Seth Weidman

第 3 章从零开始的深度学习从零开始的深度学习

深度学习的定义：初体验

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

设计数据密集型应用程序

PyTorch深度学习

数据驱动力：企业数据分析实战

R深度学习权威指南

Publisher Resources

第 3 章 从零开始的深度学习 从零开始的深度学习

深度学习的定义：初体验

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

设计数据密集型应用程序

PyTorch深度学习

数据驱动力：企业数据分析实战

R深度学习权威指南

Publisher Resources

第 3 章从零开始的深度学习从零开始的深度学习

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.