book

为深度学习编程 PyTorch

by Ian Pointer

July 2025

Intermediate to advanced

220 pages

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

当今世界的深度学习但究竟什么是 Deep Learning，我需要博士学位才能理解它吗？PyTorchTensorFlow 怎么样？本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
构建自定义深度学习机器图形处理器中央处理器/主板内存存储云中的深度学习谷歌实验室云提供商我应该使用哪个云提供商？使用 Jupyter Notebook从零开始安装 PyTorch下载 CUDAAnaconda最后是 PyTorch！(和 Jupyter Notebook）Tensors张量运算张量广播结论更多阅读
我们的分类问题传统挑战但首先是数据PyTorch 和数据加载器构建训练数据集构建验证和测试数据集最后，神经网络！激活函数创建网络损失函数优化训练在 GPU 上运行拼凑起来进行预测保存模型结论更多阅读
我们的第一个卷积模型卷积池化辍学CNN 架构的历史AlexNetInception/GoogLeNetVGGResNet其他架构可用！在 PyTorch 中使用预训练模型检查模型结构批处理规范您应该使用哪种模型？一站式购买模型：PyTorch Hub结论延伸阅读
使用 ResNet 进行迁移学习寻找学习率差异学习率数据扩充火炬视觉变换色彩空间和 Lambda 变换自定义变换类从小到大集合结论更多阅读
递归神经网络长短期记忆网络门控循环单元biLSTM嵌入火炬文本获取数据推文定义字段建立词汇表创建模型更新训练循环对推文进行分类数据扩充随机插入随机删除随机交换回译增强和火炬文本迁移学习？结论更多阅读
声音ESC-50 数据集获取数据集在 Jupyter 中播放音频探索 ESC-50SoX 和 LibROSAtorchaudio建立 ESC-50 数据集用于 ESC-50 的 CNN 模型这个频率就是我的宇宙梅尔频谱图新数据集一个野生 ResNet 出现了寻找学习率音频数据增强torchaudio变换SoX 效果链规格增强更多实验结论更多阅读
现在是凌晨 3 点，您的数据在做什么？张量板安装 TensorBoard向 TensorBoard 发送数据PyTorch 挂钩绘制平均值和标准偏差类激活映射火焰图安装 py-spy读取火焰图修复缓慢的转换调试 GPU 问题检查 GPU梯度检查点结论延伸阅读
模型服务构建 Flask 服务设置模型参数构建 Docker 容器本地存储与云存储日志和遥测在 Kubernetes 上部署在谷歌 Kubernetes 引擎上进行设置创建 k8s 集群扩展服务更新和清理TorchScript跟踪脚本编写TorchScript 的限制使用 libTorch获取 libTorch 和 Hello World导入 TorchScript 模型结论延伸阅读
数据增强：混合与平滑混淆标签平滑计算机，增强！超分辨率简介GAN 简介伪造者与批评者训练 GAN模式崩溃的危险ESRGAN图像检测的进一步探险物体检测更快的 R-CNN 和掩码 R-CNN对抗样本黑盒攻击抵御对抗性攻击远不止于此：变压器架构关注关注就是一切BERTFastBERTGPT-2使用 GPT-2 生成文本ULMFiT使用什么？结论进一步阅读

Content preview from 为深度学习编程 PyTorch

第 2 章用 PyTorch 进行图像分类用 PyTorch 进行图像分类

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在你设置好 PyTorch 之后，深度学习教科书通常会在做任何有趣的事情之前向你抛出一堆专业术语。我尽量少用这些术语，而是通过一个例子来说明，尽管这个例子很容易随着你对 PyTorch 的使用越来越熟练而扩展。我们在本书中一直使用这个例子来演示如何调试模型（第 7 章）或将其部署到生产中（第 8 章）。

从现在开始到第 4 章结束，我们要构建的是一个图像分类器。神经网络通常用作图像分类器；给网络一张图片，然后问它一个对我们来说很简单的问题："这是什么？"

让我们开始构建我们的 PyTorch 应用程序。

我们的分类问题

在这里，我们要构建一个简单的分类器，它可以区分鱼和猫。我们将不断迭代设计和构建模型的方法，使其越来越精确。

图2-1和图2-2展示了一条鱼和一只猫。我不确定鱼是否有名字，但猫的名字叫 Helvetica。

首先，让我们来讨论一下分类所面临的传统挑战。

传统挑战

你会如何编写一个能区分鱼和猫的程序呢？也许你会编写一套规则，描述猫有尾巴或鱼有鳞片，然后将这些规则应用到图像中，以确定你正在看的是什么。但这需要时间、精力和技巧。另外，如果你遇到了像曼克斯猫这样的动物，虽然它很明显是一只猫，但却没有尾巴，那该怎么办呢？

你可以看到，为了描述所有可能发生的情况，这些规则会变得越来越复杂。另外，我得承认，我在图形编程方面非常糟糕，所以一想到要手动编写所有这些规则，我就感到害怕。

我们需要的是一个函数，在输入图像的情况下，返回猫或鱼。我们很难通过详尽罗列所有条件来构建这个函数。但 Deep Learning 本质上是让计算机来完成我们刚才谈到的构建所有这些规则的艰苦工作--只要我们创建一个结构，给网络提供大量数据，并让它有办法找出是否得到了正确的答案。这就是我们要做的。一路上，你将学习到如何使用 PyTorch 的一些关键概念。

但首先是数据

首先，我们需要数据。需要多少数据？这要看情况。要想让任何 Deep Learning 技术发挥作用，你都需要大量数据来训练神经网络，这种想法并不一定正确，你将在第 4 章中看到这一点。不过，现在我们要从头开始训练，这通常确实需要获取大量数据。我们需要大量的鱼和猫的图片。

现在，我们可以花一些时间从谷歌图片搜索之类的地方下载许多图片，但在这种情况下，我们有一个捷径：一个用于训练神经网络的标准图片集，名为 ImageNet。它包含 1400 多万张图像和 20000 个图像类别。它是所有图像分类器自我评判的标准。因此，我从这里获取图像，当然，如果你喜欢，也可以自行下载其他图像。

除了数据，PyTorch 还需要一种方法来确定什么是猫，什么是鱼。这对我们来说很容易，但对计算机来说就有点难了（这也是我们首先要构建程序的原因！）。我们使用标签来连接数据，这种训练方式被称为 ...