Skip to Content
PyTorch 中的 AI 和 ML 编码
book

PyTorch 中的 AI 和 ML 编码

by Laurence Moroney
July 2025
Beginner to intermediate
444 pages
6h 20m
Chinese
O'Reilly Media, Inc.
Content preview from PyTorch 中的 AI 和 ML 编码

第 14 章. 使用第三方模型和集线器

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

开源 PyTorch 框架的成功带动了辅助生态系统的发展。在本章中,我们将介绍预训练模型的各种选项,以及用于下载、实例化和使用它们进行推理的相关工具和资源。

虽然 PyTorch 框架为深度学习提供了基础,但社区已经创建了众多存储可随时使用和扩展的模型的资源库和中心,让你可以更轻松地使用和扩展现有工作,而不是从头开始。我喜欢把这称为 "站在巨人的肩膀上"。

自生成式人工智能问世以来,这些集线器大受欢迎,工作流中生成式 ML 模型的许多应用场景也由此而生。因此,在使用预训练模型时,有很多选择。您可以直接使用它们进行推理,利用那些在大规模数据集上训练出来的模型,而复制这些数据集是不切实际的。或者,您也可以将这些模型作为微调的起点,使其适应特定领域或任务,同时保留其学习到的特征。这可以采取低阶自适应(Low-rank adaption,LoRA)的形式,我们将在第 20 章中讨论;也可以采取迁移学习的形式,将一项任务中的知识应用到另一项任务中。迁移学习或其他微调已成为一种标准做法,尤其是在数据或计算资源有限的情况下。

使用预训练模型的优势不仅仅在于节省计算资源和时间。这些模型通常代表了最先进的架构,而且已经在各种高质量数据集上进行过训练,而你可能无法直接访问这些数据集。

此外,提供商在发布模型时通常会提供大量的文档、性能基准和社区支持,从而为您提供了一个良好的开端。考虑到负责任的人工智能的重要性,这些模型通常会附带模型卡,帮助您了解任何研究和工作,以便您能够处理任何潜在的责任问题。

世界上不存在 "万能集线器",因此了解每个主要集线器以及如何充分利用它们是非常有用的。为此,我们将在本章中介绍一些更受欢迎的枢纽。

Hugging Face 已成为变换器模型的事实标准,而 PyTorch Hub 则提供官方支持的实现。Kaggle 等平台提供竞赛获奖模型,而基于 GitHub 的 TorchHub 则可以直接访问研究实现。

我认为,了解这些资源以及如何有效利用它们对你来说非常重要。随着 Deep Learning 领域的不断进步,这些中心在拓宽对最先进模型的访问和实现人工智能应用的快速开发方面发挥着越来越关键的作用。随着人工智能开发人员角色的成熟和发展,我个人也看到了软件开发人员职业生涯的巨大发展,他们不再从头开始训练模型,而是使用或微调现有模型。为此,我希望本章能帮助你成长!

拥抱脸枢纽

近年来,尤其是随着 生成式人工智能的兴起,Hugging Face Hub 已成为发现和使用预训练 ML 模型(尤其是 NLP 模型)的领先平台。它的实用性(也是其成功的一个重要驱动因素)主要体现在两方面的开源性:一个转换器库(它使预训练语言模型的使用变得非常简单)和一个扩散器库(它同样适用于文本到图像的生成模型,如稳定扩散模型)。

因此,从最初的基于变换器的模型库发展成为一个支持计算机视觉、音频处理和强化学习模型的综合生态系统。它已发展成为一个集模型版本控制、文档和模型卡于一体的一站式商店,而且由于使用了变压器和扩散器等 PyTorch 友好型库,利用 Python 和 PyTorch 技能使用这些模型也变得相对容易。

协作也是 Hub 成功的关键之一。只需几行代码,您就可以下载、使用和微调模型,许多开发者和组织都与社区分享了他们的模型或微调。在撰写本文时,有超过 900,000 个公开可用的模型,因此可供选择的余地很大! ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

在企业中实施 MLOps

在企业中实施 MLOps

Yaron Haviv, Noah Gift
图解大模型 : 生成式AI 原理与实战

图解大模型 : 生成式AI 原理与实战

Jay Alammar, Maarten Grootendorst

Publisher Resources

ISBN: 9798341662599