book

PyTorch 中的 AI 和 ML 编码

Name: PyTorch 中的 AI 和 ML 编码
Author: Laurence Moroney
ISBN: 9798341662599

by Laurence Moroney

July 2025

Beginner to intermediate

444 pages

6h 20m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
序言
谁应该阅读本书我为什么写这本书本书导航您需要了解的技术在线资源本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.PyTorch 简介
什么是机器学习？传统编程的局限性从编程到学习什么是 PyTorch？使用 PyTorch在 Python 中安装 Porch在 PyCharm 中使用 PyTorch在 Google Colab 中使用 PyTorch机器学习入门查看网络的学习成果概述
2.计算机视觉简介
计算机视觉如何工作时尚 MNIST 数据库视觉神经元设计神经网络完整代码训练神经网络探索模型输出过拟合早期停止总结
3.Going Beyond the Basics：检测图像中的特征
卷积池化实现卷积神经网络探索卷积网络构建 CNN 以区分马和人类马或人 "数据集处理数据马或人 "的 CNN 架构为 "马或人 "数据集添加验证测试 "马或人 "图像图像增强迁移学习多类分类丢弃正则化总结
4.用 PyTorch 使用数据
数据集入门探索 FashionMNIST 类通用数据集类图像文件夹数据集文件夹假数据使用自定义分割管理机器学习数据的 ETL 流程优化加载阶段使用数据加载器类批处理洗牌并行数据加载自定义数据采样并行化 ETL 以提高训练性能总结
5.自然语言处理入门
将语言编码为数字标记化入门将句子转化为序列删除停顿词和清理文本剔除 HTML 标记剔除停顿词剔除标点符号使用真实数据源获取文本数据集从 CSV 文件获取文本从 JSON 文件获取文本总结
6.使用嵌入式技术使情感可编程
从单词中确定含义一个简单的例子：正反面更深入一点：向量PyTorch 中的嵌入算法使用嵌入构建讽刺检测器减少语言模型的过度拟合综合运用使用模型对句子进行分类嵌入的可视化使用预训练嵌入摘要
7.用于自然语言处理的递归神经网络
递归的基础为语言扩展递归使用 RNN 创建文本分类器堆叠 LSTM将预训练嵌入与 RNNs 结合使用摘要
8.使用 ML 创建文本
将序列转化为输入序列创建模型生成文本预测下一个单词复合预测以生成文本扩展数据集改进模型架构嵌入维度初始化 LSTM可变学习率改进数据基于字符的编码摘要

9.理解序列和时间序列数据
时间序列的共同属性趋势季节性自相关性噪声预测时间序列的技术创建基线的自然预测测量预测精度较少的天真预测：使用移动平均法进行预测改进移动平均分析摘要
10.创建预测序列的 ML 模型
创建 Windows 数据集创建时间序列数据集的 Windows 窗口版本创建和训练 DNN 以适应序列数据评估 DNN 的结果调整学习率总结
11.将卷积和递归方法用于序列模型
序列数据的卷积卷积编码试验 Conv1D 超参数使用 NASA 气象数据用 Python 读取 GISS 数据使用 RNN 进行序列建模探索更大的数据集使用其他循环方法使用辍学使用双向 RNN摘要
12.推理概念
张量图像数据文本数据模型中的张量摘要
13.托管服务 PyTorch 模型
介绍 TorchServe设置 TorchServe准备环境设置 config.properties 文件定义模型创建处理程序文件创建模型存档启动服务器测试推理更进一步使用 Flask 服务为 Flask 创建环境用 Python 创建 Flask 服务器摘要
14.使用第三方模型和集线器
拥抱脸枢纽使用抱抱脸枢纽使用拥抱脸部集线器中的模型PyTorch 枢纽使用 PyTorch 视觉模型自然语言处理其他模型摘要
15.变压器和变压器
了解变换器编码器架构解码器架构编码器-解码器架构转换器 API变压器入门核心概念管道分词器摘要
16.使用自定义数据的 LLMs
微调 LLM设置和依赖性加载和检查数据初始化模型和令牌器预处理数据整理数据定义指标配置训练初始化训练器训练和评估保存和测试模型prompt 调整 LLM准备数据创建数据加载器定义模型训练模型培训期间的评估报告训练指标保存提示嵌入使用模型进行推理摘要
17.用 Ollama 服务 LLMs
Ollama 入门将 Ollama 作为服务器运行构建一个使用 Ollama LLM 的应用程序场景构建 Python 概念验证为 Ollama 创建 Web 应用程序app.js 文件Index.html 文件摘要
18.RAG 简介
什么是 RAG？开始使用 RAG了解相似性创建数据库执行相似性搜索将所有内容整合在一起在 LLM 中使用 RAG 内容扩展到托管模型摘要
19.使用抱脸式扩散器生成模型
什么是扩散模型？使用拥抱脸扩散器使用漫反射进行图像对图像处理使用漫反射进行内绘摘要
20.使用 LoRA 和扩散器调整生成图像模型
使用扩散器训练 LoRA获取漫反射获取微调 LoRA 的数据使用漫反射微调模型发布模型使用自定义 LoRA 生成图像摘要
索引
关于作者

Content preview from PyTorch 中的 AI 和 ML 编码

第 6 章利用嵌入式技术实现情感编程利用嵌入式技术实现情感编程

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在第 5 章中，我们了解了如何将单词并编码成标记。然后，你还看到了如何将包含单词的句子编码成包含标记的序列，并对其进行适当的填充或截断，最终得到一组形状良好的数据，用于训练神经网络。然而，这一切都没有对单词的含义进行任何类型的建模。虽然确实没有绝对的数字编码可以概括词义，但也有相对的数字编码。

在本章中，你将学习封装意义的技术，尤其是嵌入的概念，即在高维空间中创建向量来表示单词。这些向量的方向可以根据语料库中单词的使用情况逐渐学习。然后，当你得到一个句子时，你可以调查单词向量的方向，将它们求和，并从求和的整体方向出发，将句子的情感确立为其单词的乘积。此外，与此相关的是，当模型扫描句子时，句子中单词的定位也有助于训练适当的嵌入。

在本章中，我们还将探讨其工作原理。使用第 5 章中的新闻标题数据集进行讽刺句检测，您将建立嵌入，帮助模型检测句子中的讽刺句。您还将使用一些很酷的可视化工具，帮助您了解语料库中的单词是如何映射到向量的，这样您就可以看到哪些单词决定了整体分类。

从单词中确定意义

在了解用于嵌入的高维向量之前，让我们用一些简单的例子来尝试可视化如何从数字中得出意义。考虑一下：使用第 5 章中的讽刺数据集，如果用正数对构成讽刺性标题的所有单词进行编码，用负数对构成现实性标题的所有单词进行编码，结果会怎样？

一个简单的例子：正方和反方

以数据集中的这个讽刺性标题为例：

christian bale given neutered male statuette named oscar

假设我们词汇表中所有单词的起始值都是 0，那么我们可以将这句话中每个单词的值都加上 1，最后得到这个结果：

{ "christian" : 1, "bale" : 1, "given" : 1, "neutered": 1, "male" : 1, 
  "statuette": 1, "named" : 1, "oscar": 1}

注释

这与您在上一章中所做的单词标记化不同。您可以考虑将每个单词（如christian）替换为从语料库中编码的代表该单词的标记，但为了使代码更易于阅读，我还是暂时保留这些单词。

然后，在下一步中，考虑一个普通的标题（不是讽刺性标题），就像这样：

gareth bale scores wonder goal against germany

由于这是一种不同的情绪，我们可以从每个词的当前值中减去 1，这样我们的值集就会是这样：

{ "christian" : 1, "bale" : 0, "given" : 1, "neutered": 1, "male" : 1,
  "statuette": 1, "named" : 1, "oscar": 1, "gareth" : –1, "scores": –1,
  "wonder" : –1, "goal" : –1, "against" : –1, "germany" : –1}

请注意，讽刺性的bale （来自christian bale ）已被非讽刺性的bale （来自gareth bale ）所抵消，因此它的得分最终为 0。重复此过程数千次后，您将从语料库中得到一个庞大的单词列表，该列表根据单词的用法进行评分。

现在，想象一下我们想要确定这个句子的情感：

neutered male named against

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341662599

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

PyTorch 中的 AI 和 ML 编码

by Laurence Moroney

第 6 章利用嵌入式技术实现情感编程利用嵌入式技术实现情感编程

从单词中确定意义

一个简单的例子：正方和反方

注释

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

在企业中实施 MLOps

快速提升人工智能产品的实用指南

图解大模型 : 生成式AI 原理与实战

LangChain在生命科学与医疗健康领域的应用

Publisher Resources

第 6 章 利用嵌入式技术实现情感编程 利用嵌入式技术实现情感编程

从单词中确定意义

一个简单的例子：正方和反方

注释

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

在企业中实施 MLOps

快速提升人工智能产品的实用指南

图解大模型 : 生成式AI 原理与实战

LangChain在生命科学与医疗健康领域的应用

Publisher Resources

第 6 章利用嵌入式技术实现情感编程利用嵌入式技术实现情感编程

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.