book

从零开始学习深度学习

Name: 从零开始学习深度学习
Author: Seth Weidman
ISBN: 9798341657755

by Seth Weidman

May 2025

Beginner to intermediate

252 pages

3h 16m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
理解神经网络需要多种心理模型章节大纲本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.基础
功能数学图表代码衍生产品数学图表代码嵌套函数图表数学代码另一张图表连锁规则数学代码一个稍长的例子数学图表代码多输入功能数学图表代码多输入函数的导数图表数学代码多矢量输入函数数学从现有功能创建新功能数学图表代码多向量输入函数的导数图表数学代码矢量函数及其导数：更进一步图表数学代码矢量函数及其导数后向传递有两个二维矩阵输入的计算图数学图表代码有趣的部分向后传球图表数学代码结论
2.基础知识
监督学习概述监督学习模型线性回归线性回归：图解线性回归：更有用的图表（和数学知识）添加截距线性回归：代码训练模型计算梯度示意图计算梯度：数学（和一些代码）计算梯度完整）代码使用这些梯度来训练模型评估我们的模型：训练集与测试集评估我们的模式：守则分析最重要的特征从零开始的神经网络步骤 1：一系列线性回归步骤 2：非线性函数步骤 3：另一次线性回归图表代码神经网络：后向传递训练和评估我们的第一个神经网络出现这种情况的两个原因结论
3.从零开始的 Deep Learning
深度学习的定义：初体验神经网络的构件：操作图表代码神经网络的构件：层图表积木上的积木图层蓝图致密层神经网络类，也许还有其他类图表代码损失等级从零开始的 Deep Learning实施批量培训神经网络代码培训师和优化师优化器训练员把所有东西放在一起我们的首个 Deep Learning 模型（从零开始）结论和下一步措施
4.扩展
关于神经网络的一些直觉Softmax 交叉熵损失函数组件 1：软最大函数组成部分 2：交叉熵损失关于激活功能的说明实验数据预处理模型实验Softmax 交叉熵损失动力动力直觉在优化器类中实现动量实验随机梯度下降与动量学习率衰减学习率衰减的类型实验：学习率衰减重量初始化数学与代码实验：权重初始化辍学定义实施情况实验：辍学结论
5.卷积神经网络
神经网络和表征学习图像数据的不同架构卷积操作多通道卷积操作卷积层实施影响卷积层与全连接层的区别利用卷积层进行预测扁平层汇集层执行多通道卷积操作前传卷曲：后退通道批处理、二维卷积和多通道二维卷积最后的元素添加 "通道使用该操作训练 CNN压平操作完整的 Conv2D 层实验结论
6.递归神经网络
关键限制：处理分支自动区分梯度累积编码建立递归神经网络的动机递归神经网络简介RNN 第一课RNNLayerRNN 的第二课堂RNNN 节点将这两门课结合起来后退通道RNNs：代码RNNLayer 类RNN 节点的基本要素"香草 "RNN 节点普通 "RNN 节点的局限性一个解决方案GRUNodesLSTMNodes基于字符级 RNN 语言模型的数据表示方法其他语言建模任务组合 RNNLayer 变体将这一切融为一体结论
7.PyTorch
PyTorch 张量器使用 PyTorch 进行深度学习PyTorch 元素：模型、层、优化器和损耗使用 PyTorch 实现神经网络构建模块：密集层示例：PyTorch 中的波士顿房价模型PyTorch 元素：优化器和损耗PyTorch 元素：训练器在 PyTorch 中优化学习的技巧PyTorch 中的卷积神经网络数据加载器和变换PyTorch 中的 LSTM后记通过自动编码器进行无监督学习表征学习处理无标签情况的方法在 PyTorch 中实现自动编码器无监督学习的更大考验和解决方案结论
A.深度潜水
矩阵链规则相对于偏差项的损失梯度通过矩阵乘法进行卷积
索引

Content preview from 从零开始学习深度学习

第 2 章基础知识

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在第 1 章中，我描述了理解 Deep Learning 的主要概念构件：嵌套、连续、可微函数。我展示了如何将这些函数表示为计算图，图中的每个节点代表一个单一、简单的函数。特别是，我演示了这种表示法可以轻松计算嵌套函数的输出相对于输入的导数：我们只需求出所有组成函数的导数，在这些函数接收到的输入处评估这些导数，然后将所有结果相乘；由于链式法则，这将得出嵌套函数的正确导数。我用一些简单的例子说明了这一方法确实有效，这些函数将 NumPy 的ndarrays 作为输入，并将ndarrays 作为输出。

我的演示表明，即使函数接收多个ndarrays 作为输入，并通过矩阵乘法运算将它们组合，这种计算导数的方法也能奏效。与我们看到的其他运算不同，矩阵乘法运算会改变输入的形状。具体来说，如果该运算的一个输入（称作输入X）是一个 B × Nndarray ，而该运算的另一个输入（W）是一个 N × Mndarray ，那么其输出P就是一个 B × Mndarray 。虽然还不清楚这种运算的导数是什么，但我已经证明，当矩阵乘法ν(X,W)作为 "组成运算 "被包含在嵌套函数中时，我们仍然可以用一个简单的表达式代替它的导数来计算其输入的导数：具体来说，∂的作用是 $\frac{\partial ν}{\partial u} (W)$ 可以由^XT 代替，而 $\frac{\partial ν}{\partial u} (X)$ 可以由^WT 播放。

在本章中，我们将开始把这些概念转化为实际应用：

用这些构件表示线性回归
证明我们在第 1 章中进行的导数推理可以训练出这个线性回归模型
将此模型（仍使用我们的构建模块）扩展为单层神经网络

然后，在第 3 章中，将直接使用这些相同的构建模块来构建 Deep Learning 模型。

不过，在深入探讨这一切之前，让我们先来概述一下监督学习，这是机器学习的一个子集，在我们了解如何使用神经网络来解决问题时，我们将重点关注监督学习。

监督学习概述

在的高层次上，机器学习可以被描述为构建算法，该算法可以发现或 "学习 "数据中的关系；监督学习可以被描述为机器学习的子集，专门用于发现已经测量过的数据特征之间的关系。¹

在本章中，我们将讨论一个在现实世界中可能遇到的典型的监督学习问题：寻找房屋特征与房屋价值之间的关系。显然，房间数量、面积或学校远近等特征与房屋的居住或拥有价值之间存在某种关系。从高层次上讲，监督学习的目的就是发现这些关系，因为我们已经测量了这些特征。

我所说的 "测量 "是指每个特征都经过精确定义，并用数字来表示。房屋的许多特征，如卧室数量、面积等，自然可以用数字来表示，但如果我们有其他不同类型的信息，如 TripAdvisor 提供的房屋周边环境的自然语言描述，这部分问题就不那么简单了，而如何将这些结构化程度较低的数据以合理的方式转换成数字，可能会影响我们发现关系的能力。此外，对于任何定义模糊的概念，例如房子的价值，我们只需选择一个数字来描述它；在这里，一个显而易见的选择就是使用房子的价格。²

一旦我们将 "特征 "转化为数字，就必须决定用什么结构来表示这些数字。在机器学习中，有一种结构几乎是通用的，而且计算起来也很容易，那就是将单个观测值的每组数字--例如，单个房屋--表示为一行数据，然后将这些行堆叠在一起，形成 "批次 "数据，这些数据将以二维ndarrays 的形式输入我们的模型。然后，我们的模型将以输出ndarrays 的形式返回预测结果，每个预测结果为一行，同样地，这些数据也是堆叠在一起的，批次中的每个观测值都有一个预测结果。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341657755

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

从零开始学习深度学习

by Seth Weidman

第 2 章基础知识

监督学习概述

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.