book

为深度学习编程 PyTorch

by Ian Pointer

July 2025

Intermediate to advanced

220 pages

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

当今世界的深度学习但究竟什么是 Deep Learning，我需要博士学位才能理解它吗？PyTorchTensorFlow 怎么样？本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
构建自定义深度学习机器图形处理器中央处理器/主板内存存储云中的深度学习谷歌实验室云提供商我应该使用哪个云提供商？使用 Jupyter Notebook从零开始安装 PyTorch下载 CUDAAnaconda最后是 PyTorch！(和 Jupyter Notebook）Tensors张量运算张量广播结论更多阅读
我们的分类问题传统挑战但首先是数据PyTorch 和数据加载器构建训练数据集构建验证和测试数据集最后，神经网络！激活函数创建网络损失函数优化训练在 GPU 上运行拼凑起来进行预测保存模型结论更多阅读
我们的第一个卷积模型卷积池化辍学CNN 架构的历史AlexNetInception/GoogLeNetVGGResNet其他架构可用！在 PyTorch 中使用预训练模型检查模型结构批处理规范您应该使用哪种模型？一站式购买模型：PyTorch Hub结论延伸阅读
使用 ResNet 进行迁移学习寻找学习率差异学习率数据扩充火炬视觉变换色彩空间和 Lambda 变换自定义变换类从小到大集合结论更多阅读
递归神经网络长短期记忆网络门控循环单元biLSTM嵌入火炬文本获取数据推文定义字段建立词汇表创建模型更新训练循环对推文进行分类数据扩充随机插入随机删除随机交换回译增强和火炬文本迁移学习？结论更多阅读
声音ESC-50 数据集获取数据集在 Jupyter 中播放音频探索 ESC-50SoX 和 LibROSAtorchaudio建立 ESC-50 数据集用于 ESC-50 的 CNN 模型这个频率就是我的宇宙梅尔频谱图新数据集一个野生 ResNet 出现了寻找学习率音频数据增强torchaudio变换SoX 效果链规格增强更多实验结论更多阅读
现在是凌晨 3 点，您的数据在做什么？张量板安装 TensorBoard向 TensorBoard 发送数据PyTorch 挂钩绘制平均值和标准偏差类激活映射火焰图安装 py-spy读取火焰图修复缓慢的转换调试 GPU 问题检查 GPU梯度检查点结论延伸阅读
模型服务构建 Flask 服务设置模型参数构建 Docker 容器本地存储与云存储日志和遥测在 Kubernetes 上部署在谷歌 Kubernetes 引擎上进行设置创建 k8s 集群扩展服务更新和清理TorchScript跟踪脚本编写TorchScript 的限制使用 libTorch获取 libTorch 和 Hello World导入 TorchScript 模型结论延伸阅读
数据增强：混合与平滑混淆标签平滑计算机，增强！超分辨率简介GAN 简介伪造者与批评者训练 GAN模式崩溃的危险ESRGAN图像检测的进一步探险物体检测更快的 R-CNN 和掩码 R-CNN对抗样本黑盒攻击抵御对抗性攻击远不止于此：变压器架构关注关注就是一切BERTFastBERTGPT-2使用 GPT-2 生成文本ULMFiT使用什么？结论进一步阅读

Content preview from 为深度学习编程 PyTorch

第 4 章. 迁移学习和其他技巧

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

看过上一章的架构后，你可能会想，是否可以下载一个已经训练好的模型，然后对它进行进一步的训练。答案是肯定的！这是 Deep Learning 圈子里一种非常强大的技术，叫做迁移学习（transfer learning），即把为一项任务（如 ImageNet）训练的网络调整为另一项任务（鱼与猫）。

为什么要这么做呢？事实证明，在 ImageNet 上训练出来的架构已经对图像有了非常深入的了解，尤其是对某物是猫还是鱼（或狗或鲸鱼）有了相当深入的了解。由于你不再从一个基本空白的神经网络开始，因此使用迁移学习，你可能花费更少的时间进行训练，而且你可以使用更小的训练数据集。传统的 Deep Learning 方法需要海量数据才能产生好的结果。而使用迁移学习，只需几百张图片就能建立人类级别的分类器。

使用 ResNet 进行迁移学习

现在，显而易见的做法是创建一个 ResNet 模型，就像我们在第 3 章中所做的那样，将其放入现有的训练循环中。你可以这么做！ResNet 模型并没有什么神奇之处，它也是由你已经见过的相同构件建立起来的。不过，它是一个庞大的模型，虽然与基线 ResNet 模型相比，您的数据会有一些改进，但您需要大量的数据，以确保训练信号能够到达架构的各个部分，并对它们进行显著的训练，以完成新的分类任务。在这种方法中，我们尽量避免使用大量数据。

但问题是：我们所处理的架构并不像过去那样是用随机参数初始化的。我们预先训练好的 ResNet 模型已经包含了大量信息，可以满足图像识别和分类的需要，所以为什么还要费心重新训练它呢？相反，我们要对网络进行微调。我们稍微改变一下架构，在末端加入一个新的网络块，取代通常执行 ImageNet 分类的标准 1,000 类线性层。然后，我们冻结所有现有的 ResNet 层，在训练时，我们只更新新层的参数，但仍采用冻结层的激活值。这样，我们就能在快速训练新层的同时，保留预训练层已包含的信息。

首先，让我们创建一个预训练的 ResNet-50 模型：

from torchvision import models
transfer_model = models.ResNet50(pretrained=True)

接下来，我们需要冻结各层。方法很简单：使用requires_grad() 阻止它们积累梯度。我们需要对网络中的每一个参数都这么做，不过好在 PyTorch 提供了一个parameters() 方法，让这一操作变得相当简单：

for name, param in transfer_model.named_parameters():
    param.requires_grad = False

提示

您可能不想冻结模型中的BatchNorm 层，因为它们将被训练成近似于模型最初训练的数据集的均值和标准偏差，而不是您想要微调的数据集的均值和标准偏差。在BatchNorm 修正输入时，数据中的一些信号可能会丢失。您可以查看模型结构，只冻结不属于BatchNorm 的层：

for name, param in transfer_model.named_parameters():
    if("bn" not in name):
        param.requires_grad = False

然后，我们需要用一个新的分类块替换最终的分类块，我们将训练它来检测猫或鱼。在这个例子中，我们用几个Linear ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341662902Supplemental Content

为深度学习编程 PyTorch

by Ian Pointer

第 4 章. 迁移学习和其他技巧

使用 ResNet 进行迁移学习

提示

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

产品路线图全面升级

流畅的Python（第2版）

Javaクックブック第5版

超越Vibe编程

Publisher Resources

第 4 章. 迁移学习和其他技巧

使用 ResNet 进行迁移学习

提示

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

产品路线图全面升级

流畅的Python（第2版）

Javaクックブック第5版

超越Vibe编程

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.