book

PyTorch 口袋参考手册

Name: PyTorch 口袋参考手册
Author: Joe Papa
ISBN: 9798341658790

by Joe Papa

May 2025

Intermediate to advanced

310 pages

3h 16m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
谁应该阅读这本书我为什么写这本书本书导航本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.PyTorch 简介
什么是 PyTorch？为什么使用 PyTorch？入门在谷歌实验室中运行在本地计算机上运行在云平台上运行验证 PyTorch 环境一个有趣的例子
2.张量
什么是张量？简单的 CPU 示例简单的 GPU 示例在 CPU 和 GPU 之间移动张量创建张量张量属性数据类型从随机样本创建张量创建与其他张量相似的张量张量运算索引、切片、组合和拆分张量数学张量运算自动区分（Autograd）
3.使用 PyTorch 进行深度学习开发
整体流程数据准备数据加载数据转换数据批处理常规数据准备 (torch.utils.data)模型开发模型设计培训验证测试模型部署保存模型部署到 PyTorch Hub部署到生产环境
4.神经网络开发参考设计
利用迁移学习进行图像分类数据处理模型设计培训和验证测试和部署使用 Torchtext 进行情感分析数据处理模型设计培训和验证测试和部署生成式学习--利用 DCGAN 生成时尚-MNIST 图像数据处理模型设计培训测试和部署
5.定制 PyTorch
自定义图层和激活自定义图层示例（复杂线性）自定义激活示例（复杂 ReLU）定制模型架构自定义损失功能自定义优化算法定制培训、验证和测试循环
6.PyTorch 加速与优化
TPU 上的 PyTorch多 GPU 上的 PyTorch（单机）数据并行处理并行处理模型数据并行处理与模型并行处理相结合分布式培训（多台机器）模型优化超参数调整量化修剪
7.将 PyTorch 部署到生产中
PyTorch 部署工具和库常见示例模型Python 应用程序接口TorchScript火炬服务ONNX流动图书馆部署到 Flask 应用程序Colab Flask 应用程序使用 TorchServe 部署到 CloudDocker 快速入门部署到移动和边缘iOS安卓其他边缘设备
8.PyTorch 生态系统和其他资源
PyTorch 生态系统用于图像和视频的火炬视觉数据集和输入/输出机型变换、操作和实用程序用于 NLP 的 Torchtext创建数据集对象预处理数据创建批处理数据加载器数据（torchtext.data）数据集 (torchtext.datasets)词汇表 (torchtext.vocab)用于可视化的 TensorBoard使用 SCALARS 学习曲线使用 GRAPHS 建立模型架构带有图像、文本和投影仪的数据使用 DISTRIBUTIONS 和 HISTOGRAMS 进行权重分布使用 HPARAMS 的超参数TensorBoard 应用程序接口带代码的论文PyTorch 的其他资源教程书籍在线课程和现场培训
索引

Content preview from PyTorch 口袋参考手册

第 6 章 PyTorch 加速和优化 PyTorch 加速和优化

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在前面的章节中，你学习了如何使用 PyTorch 的内置功能，并通过创建自己的深度学习自定义组件来扩展这些功能。这样做可以让你快速设计新模型和训练它们的算法。

然而，在处理超大数据集或更复杂的模型时，在单个 CPU 或 GPU 上训练模型可能会耗费很长时间--可能需要几天甚至几周才能得到初步结果。较长的训练时间可能会令人沮丧，尤其是当您想使用不同的超参数配置进行多次实验时。

在本章中，我们将探索使用 PyTorch 加速和优化模型开发的最新技术。首先，我们将了解使用张量处理单元（TPU）而不是 GPU 设备的情况，并考虑使用 TPU 可以提高性能的实例。接下来，我将向您展示如何使用 PyTorch 的内置功能进行并行处理和分布式训练。这将为在多个 GPU 和多台机器上训练模型提供快速参考，以便在有更多硬件资源可用时快速扩展训练。在探索加速训练的方法之后，我们将了解如何使用超参数调整、量化和剪枝等高级技术来优化模型。

本章还将提供参考代码，使入门更加容易，并提供我们使用过的关键软件包和库的参考。创建模型和训练循环后，您可以返回本章了解如何加速和优化训练过程的技巧。

让我们从探索如何在 TPU 上运行模型开始。

TPU 上的 PyTorch

随着 Deep Learning 和人工智能的部署越来越多，各家公司都在开发定制硬件芯片或 ASIC，旨在优化硬件中的模型性能。谷歌开发了自己的 ASIC，用于 NN 加速，名为 TPU。由于 TPU 是专为 NN 设计的，因此它没有 GPU 的一些缺点，而 GPU 是专为图形处理设计的。谷歌的 TPU 现已作为 Google Cloud TPU 的一部分供您使用。您还可以使用 TPU 运行 Google Colab。

在前面的章节中，我向您展示了如何使用 GPU 测试和训练深度模型。如果以下条件适用于您的使用案例，您应该继续使用 CPU 和 GPU 进行训练：

你们有小批量的小型或中型机型。
您的模型不需要很长时间就能训练出来。
数据进出是主要瓶颈。
您的计算经常使用分支，或者主要以元素为单位进行计算，或者使用稀疏内存访问。
您需要使用高精度。热塑性聚氨酯不适合双面胶。

另一方面，使用 TPU 而不是 GPU 进行训练有几个原因。TPU 在执行密集向量和矩阵计算时速度非常快。它们针对特定的工作负载进行了优化。当以下情况适用于您的使用案例时，您应强烈考虑使用 TPU：

您的模型以矩阵计算为主。
您的模型训练时间较长。
您希望在 TPU 上对整个训练循环进行多次迭代。

在 TPU 上运行与在 CPU 或 GPU 上运行非常相似。让我们在下面的代码中重温一下如何在 GPU 上训练模型：

device = torch.device("cuda" if
  torch.cuda.is_available() else "cpu") 

model.to(device) 
for epoch in range(n_epochs):
  for data in trainloader:
    input, labels ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341658790

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

PyTorch 口袋参考手册

by Joe Papa

第 6 章 PyTorch 加速和优化 PyTorch 加速和优化

TPU 上的 PyTorch

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.