book

从零开始学习深度学习

by Seth Weidman

May 2025

Beginner to intermediate

252 pages

3h 16m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

理解神经网络需要多种心理模型章节大纲本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
功能数学图表代码衍生产品数学图表代码嵌套函数图表数学代码另一张图表连锁规则数学代码一个稍长的例子数学图表代码多输入功能数学图表代码多输入函数的导数图表数学代码多矢量输入函数数学从现有功能创建新功能数学图表代码多向量输入函数的导数图表数学代码矢量函数及其导数：更进一步图表数学代码矢量函数及其导数后向传递有两个二维矩阵输入的计算图数学图表代码有趣的部分向后传球图表数学代码结论
监督学习概述监督学习模型线性回归线性回归：图解线性回归：更有用的图表（和数学知识）添加截距线性回归：代码训练模型计算梯度示意图计算梯度：数学（和一些代码）计算梯度完整）代码使用这些梯度来训练模型评估我们的模型：训练集与测试集评估我们的模式：守则分析最重要的特征从零开始的神经网络步骤 1：一系列线性回归步骤 2：非线性函数步骤 3：另一次线性回归图表代码神经网络：后向传递训练和评估我们的第一个神经网络出现这种情况的两个原因结论
深度学习的定义：初体验神经网络的构件：操作图表代码神经网络的构件：层图表积木上的积木图层蓝图致密层神经网络类，也许还有其他类图表代码损失等级从零开始的 Deep Learning实施批量培训神经网络代码培训师和优化师优化器训练员把所有东西放在一起我们的首个 Deep Learning 模型（从零开始）结论和下一步措施
关于神经网络的一些直觉Softmax 交叉熵损失函数组件 1：软最大函数组成部分 2：交叉熵损失关于激活功能的说明实验数据预处理模型实验Softmax 交叉熵损失动力动力直觉在优化器类中实现动量实验随机梯度下降与动量学习率衰减学习率衰减的类型实验：学习率衰减重量初始化数学与代码实验：权重初始化辍学定义实施情况实验：辍学结论
神经网络和表征学习图像数据的不同架构卷积操作多通道卷积操作卷积层实施影响卷积层与全连接层的区别利用卷积层进行预测扁平层汇集层执行多通道卷积操作前传卷曲：后退通道批处理、二维卷积和多通道二维卷积最后的元素添加 "通道使用该操作训练 CNN压平操作完整的 Conv2D 层实验结论
关键限制：处理分支自动区分梯度累积编码建立递归神经网络的动机递归神经网络简介RNN 第一课RNNLayerRNN 的第二课堂RNNN 节点将这两门课结合起来后退通道RNNs：代码RNNLayer 类RNN 节点的基本要素"香草 "RNN 节点普通 "RNN 节点的局限性一个解决方案GRUNodesLSTMNodes基于字符级 RNN 语言模型的数据表示方法其他语言建模任务组合 RNNLayer 变体将这一切融为一体结论
PyTorch 张量器使用 PyTorch 进行深度学习PyTorch 元素：模型、层、优化器和损耗使用 PyTorch 实现神经网络构建模块：密集层示例：PyTorch 中的波士顿房价模型PyTorch 元素：优化器和损耗PyTorch 元素：训练器在 PyTorch 中优化学习的技巧PyTorch 中的卷积神经网络数据加载器和变换PyTorch 中的 LSTM后记通过自动编码器进行无监督学习表征学习处理无标签情况的方法在 PyTorch 中实现自动编码器无监督学习的更大考验和解决方案结论
矩阵链规则相对于偏差项的损失梯度通过矩阵乘法进行卷积

Content preview from 从零开始学习深度学习

第 1 章基础基础

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

不要死记硬背这些公式。如果你理解了这些概念，就可以发明自己的符号。

约翰-科克伦，《2006 年投资说明

本章的目的是解释一些基础思维模型，这些模型对于理解神经网络的工作原理至关重要。具体来说，我们将介绍嵌套数学函数及其导数。我们将从最简单的构件出发，说明我们可以构建由 "链式 "组成函数构成的复杂函数，即使其中一个函数是矩阵乘法，需要输入多个输入，也可以计算函数输出相对于输入的导数。了解这一过程的工作原理对于理解神经网络至关重要，从技术上讲，我们要到第 2 章才开始涉及神经网络。

在我们了解神经网络的这些基础构件时，我们将从三个方面系统地描述我们介绍的每个概念：

数学，以一个或多个方程式的形式出现
代码，尽可能减少额外的语法（因此 Python 是理想的选择）
在编码面试中，你可以在白板上画一个图表，解释正在发生的事情。

正如在序言中提到的，理解神经网络的挑战之一在于它需要多种心智模型。我们将在本章中感受到这一点：这三种视角中的每一种都排除了我们将要涉及的概念的某些基本特征，只有当它们结合在一起时，才能提供嵌套数学函数如何以及为什么以这种方式工作的全貌。事实上，我独树一帜地认为，任何试图解释神经网络构件的尝试，如果排除了这三个视角中的一个，都是不完整的。

说完这些，我们该迈出第一步了。我们将从一些极其简单的构件开始，来说明我们如何从这三个角度来理解不同的概念。我们的第一个构件将是一个简单而关键的概念：函数。

功能

什么是函数，我们该如何描述它？与神经网络一样，描述函数也有多种方法，但没有一种方法能单独描绘出一幅完整的图画。与其尝试用一句话来精辟描述，不如让我们扮演盲人摸象的角色，逐一了解这三种心智模式。

数学

这里有两个用数学符号描述的函数例子：

_f1(x)=^x2
_f2(x)=max(x, 0)

这个符号表示，我们任意称作_f1和_f2 的函数接受一个数字x作为输入，并将其转换为^x2（第一种情况）或max(x,0)（第二种情况）。

图表

描绘功能的一种方法是：

绘制x-y平面（其中x指横轴，y指纵轴）。
绘制一堆点，其中点的 x 坐标是函数在某个范围内的输入（通常是均匀分布的），y 坐标是函数在该范围内的输出。
将这些绘制的点连接起来。

这是法国哲学家勒内-笛卡尔（René Descartes）首次采用的方法，在数学的许多领域，尤其是微积分领域都非常有用。图 1-1显示了这两个函数的曲线图。

Two continuous, mostly differentiable functions

不过，，还有另一种描绘函数的方法，这种方法在学习微积分时并不那么有用，但在我们思考 Deep Learning 模型时却非常有用。我们可以将函数看作是接收数字作为输入并产生数字作为输出的盒子，就像迷你工厂一样，它们有自己的内部规则来处理输入。图 1-2展示了这些函数作为一般规则的描述，以及它们如何对特定输入进行操作。

图 1-2. 观察这些功能的另一种方法

代码

最后，我们可以用代码来描述这些函数。在此之前，我们应该先介绍一下我们将在其上编写函数的 Python 库：NumPy。

代码注意事项 #1：NumPy ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341657755Supplemental Content

从零开始学习深度学习

by Seth Weidman

第 1 章基础基础

功能

数学

图表

图 1-1. 两个连续的、大部分可微的函数

图 1-2. 观察这些功能的另一种方法

代码

代码注意事项 #1：NumPy ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

设计数据密集型应用程序

PyTorch深度学习

数据驱动力：企业数据分析实战

R深度学习权威指南

Publisher Resources

第 1 章 基础 基础

功能

数学

图表

图 1-1. 两个连续的、大部分可微的函数

图 1-2. 观察这些功能的另一种方法

代码

代码注意事项 #1：NumPy ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

设计数据密集型应用程序

PyTorch深度学习

数据驱动力：企业数据分析实战

R深度学习权威指南

Publisher Resources

第 1 章基础基础

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.