book

AI工程

Name: AI工程
Author: Chip Huyen
ISBN: 0642572267506

by Chip Huyen

October 2025

Beginner to intermediate

534 pages

6h 18m

Chinese

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

序言
本书内容本书不是什么本书适用对象本书导航本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.使用基础模型构建人工智能应用简介
人工智能工程的崛起从语言模型到大型语言模型从大型语言模型到基础模型从基础模型到人工智能工程基础模型用例编码图像和视频制作写作教育对话机器人信息聚合数据组织工作流自动化规划人工智能应用用例评估设定预期里程碑规划维护人工智能工程堆栈人工智能堆栈的三个层次人工智能工程与 ML 工程人工智能工程与全栈工程概述
2.了解基础模型
训练数据多语言模型特定领域模型建模模型架构模型规模培训后监督微调偏好微调采样取样基础采样策略测试时间计算结构化输出人工智能的概率本质摘要
3.评估方法
评估基础模型的挑战了解语言建模指标熵交叉熵每字符比特数和每字节比特数复杂性复杂性解释和使用案例精确评估功能正确性与参考数据的相似性测量嵌入简介人工智能作为法官为何将人工智能用作法官？如何将人工智能用作法官人工智能作为法官的局限性哪些模型可以充当法官？通过比较评估对模型进行排序比较评估的挑战比较评估的未来摘要
4.评估人工智能系统
评估标准特定领域的能力生成能力遵循指令的能力成本与延迟模型选择模型选择工作流程模型构建与购买浏览公共基准设计您的评估管道步骤 1.评估系统中的所有组件步骤 2.创建评估指南步骤 3.确定评估方法和数据摘要
5.prompt 工程
提示简介情境学习：零镜头和少镜头系统提示和用户提示情境长度和情境效率提示工程最佳实践编写清晰明确的指令提供充分的语境将复杂任务分解为较简单的子任务给模型思考的时间迭代提示器评估提示工程工具组织和版本提示防御性提示工程专有提示和反向提示工程越狱和提示注入信息提取防范提示攻击摘要
6.RAG 与代理
RAGRAG 架构检索算法检索优化文本之外的 RAG代理代理概述工具规划代理失败模式和评估记忆摘要
7.微调
微调概述何时进行微调进行微调的原因不进行微调的原因微调与 RAG内存瓶颈反向传播和可训练参数记忆数学数值表示量化微调技术参数高效微调模型合并与多任务微调微调策略摘要
8.数据集工程
数据整理数据质量数据覆盖率数据数量数据采集与注释数据扩充与合成为什么要进行数据合成传统数据合成技术人工智能驱动的数据合成模型蒸馏数据处理检查数据重复数据清理和过滤数据格式化数据摘要
9.推理优化
了解推理优化推理概述推理性能指标人工智能加速器推理优化模型优化推理服务优化概要

10.人工智能工程架构和用户反馈
人工智能工程架构步骤 1.增强语境步骤 2.设置防护栏步骤 3.添加路由器和网关模型步骤 4.使用缓存降低延迟步骤 5.添加代理模式监控和可观测性人工智能管道协调用户反馈提取对话反馈反馈设计反馈限制概述
后记
索引
关于作者

Content preview from AI工程

第 5 章提示工程

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

提示工程是指精心设计指令，使模型产生预期结果的过程。提示工程是最简单、最常用的模型调整技术。与微调不同，提示工程在不改变模型权重的情况下引导模型行为。得益于基础模型强大的基础能力，很多人已经成功地仅使用 prompt engineering 就将其调整到了应用中。在转向微调等更耗费资源的技术之前，您应该充分利用提示工程。

提示工程的易用性可能会误导人们，让他们以为提示工程并没有什么了不起。¹乍一看，提示工程似乎只是在文字上做手脚，直到成功为止。虽然提示工程确实需要做很多手脚，但它也包含许多有趣的挑战和巧妙的解决方案。你可以把 prompt 工程想象成人类与人工智能之间的交流：你与人工智能模型交流，让它们做你想做的事情。任何人都可以交流，但不是每个人都能有效地交流。同样，编写提示语很容易，但构建有效的提示语却不容易。

有些人认为，"提示工程 "缺乏严谨性，不足以成为一门工程学科。然而，事实并非如此。提示实验应该像任何 ML 实验一样严谨，进行系统的实验和评估。

我采访过的 OpenAI 的一位研究经理完美地概括了 prompt 工程的重要性："问题不在于 prompt 工程。这是一项真正有用的技能。问题在于当人们只知道 prompt engineering 时。"要构建可投入生产的人工智能应用，你需要的不仅仅是 prompt engineering。你需要统计学、工程学和经典的 ML 知识来进行实验跟踪、评估和数据集整理。

本章将介绍如何编写有效的 prompt 以及如何保护你的应用免受 prompt 攻击。在深入探讨使用 prompts 构建的各种有趣应用之前，让我们先从基础知识开始，包括到底什么是 prompt 以及 prompt 工程的最佳实践。

提示简介

提示是给模型下达的执行任务的指令。任务可以很简单，比如回答一个问题，"谁发明了数字 0？它也可以更复杂，比如要求模型为你的产品创意研究竞争对手、从头开始建立一个网站或分析你的数据。

提示一般由以下一个或多个部分组成：

任务描述: 您希望模型做什么，包括您希望模型扮演的角色和输出格式。
如何完成该任务的示例: 例如，如果您希望模型检测文本中的毒性，您可以提供一些毒性和非毒性的示例。
任务: 您希望模型完成的具体任务，例如要回答的问题或要总结的书籍。

图 5-1显示了 NER（命名实体识别）任务中可能使用的一个非常简单的提示。

A close-up of a text

Description automatically generated

要使提示发挥作用，模型必须能够遵循指令。如果模型的能力很差，那么不管你的提示有多好，模型都无法遵循它。第 4 章将讨论如何评估模型的指令遵循能力。

需要多少提示工程取决于模型对提示扰动的鲁棒性。如果提示稍有变化--比如把 "5 "写成 "5"、添加新行或改变大写字母--模型的反应会有很大不同吗？模型的鲁棒性越差，就需要更多的调整。

你可以通过随机扰动提示来衡量模型的鲁棒性，看看输出是如何变化的。就像遵循指令的能力一样，模型的鲁棒性与其整体能力密切相关。随着模型变得越来越强大，它们也会变得越来越稳健。这是有道理的，因为智能模型应该理解 "5 "和 "5 "是同一个意思。²因此，使用更强的模型往往能让您省心，并减少在摆弄上浪费的时间。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572267506

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

AI工程

by Chip Huyen

第 5 章提示工程

提示简介

图 5-1. 一个简单的 NER 提示。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.