book

AI工程

Name: AI工程
Author: Chip Huyen
ISBN: 0642572267506

by Chip Huyen

October 2025

Beginner to intermediate

534 pages

6h 18m

Chinese

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

序言
本书内容本书不是什么本书适用对象本书导航本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.使用基础模型构建人工智能应用简介
人工智能工程的崛起从语言模型到大型语言模型从大型语言模型到基础模型从基础模型到人工智能工程基础模型用例编码图像和视频制作写作教育对话机器人信息聚合数据组织工作流自动化规划人工智能应用用例评估设定预期里程碑规划维护人工智能工程堆栈人工智能堆栈的三个层次人工智能工程与 ML 工程人工智能工程与全栈工程概述
2.了解基础模型
训练数据多语言模型特定领域模型建模模型架构模型规模培训后监督微调偏好微调采样取样基础采样策略测试时间计算结构化输出人工智能的概率本质摘要
3.评估方法
评估基础模型的挑战了解语言建模指标熵交叉熵每字符比特数和每字节比特数复杂性复杂性解释和使用案例精确评估功能正确性与参考数据的相似性测量嵌入简介人工智能作为法官为何将人工智能用作法官？如何将人工智能用作法官人工智能作为法官的局限性哪些模型可以充当法官？通过比较评估对模型进行排序比较评估的挑战比较评估的未来摘要
4.评估人工智能系统
评估标准特定领域的能力生成能力遵循指令的能力成本与延迟模型选择模型选择工作流程模型构建与购买浏览公共基准设计您的评估管道步骤 1.评估系统中的所有组件步骤 2.创建评估指南步骤 3.确定评估方法和数据摘要
5.prompt 工程
提示简介情境学习：零镜头和少镜头系统提示和用户提示情境长度和情境效率提示工程最佳实践编写清晰明确的指令提供充分的语境将复杂任务分解为较简单的子任务给模型思考的时间迭代提示器评估提示工程工具组织和版本提示防御性提示工程专有提示和反向提示工程越狱和提示注入信息提取防范提示攻击摘要
6.RAG 与代理
RAGRAG 架构检索算法检索优化文本之外的 RAG代理代理概述工具规划代理失败模式和评估记忆摘要
7.微调
微调概述何时进行微调进行微调的原因不进行微调的原因微调与 RAG内存瓶颈反向传播和可训练参数记忆数学数值表示量化微调技术参数高效微调模型合并与多任务微调微调策略摘要
8.数据集工程
数据整理数据质量数据覆盖率数据数量数据采集与注释数据扩充与合成为什么要进行数据合成传统数据合成技术人工智能驱动的数据合成模型蒸馏数据处理检查数据重复数据清理和过滤数据格式化数据摘要
9.推理优化
了解推理优化推理概述推理性能指标人工智能加速器推理优化模型优化推理服务优化概要

10.人工智能工程架构和用户反馈
人工智能工程架构步骤 1.增强语境步骤 2.设置防护栏步骤 3.添加路由器和网关模型步骤 4.使用缓存降低延迟步骤 5.添加代理模式监控和可观测性人工智能管道协调用户反馈提取对话反馈反馈设计反馈限制概述
后记
索引
关于作者

Content preview from AI工程

第10章人工智能工程架构与用户反馈

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

到目前为止，本书已经介绍了大量使基础模型适应特定应用的技术。本章将讨论如何将这些技术结合起来，打造成功的产品。

鉴于现有的人工智能工程技术和工具种类繁多，选择合适的技术和工具可能会让人不知所措。为了简化这一过程，本章将采取循序渐进的方法。它从基础模型应用的最简单架构开始，强调该架构所面临的挑战，并逐步添加组件来应对这些挑战。

我们可以花很长时间推理如何构建一个成功的应用程序，但要想知道一个应用程序是否真正实现了目标，唯一的办法就是将其交付给用户。用户反馈一直是指导产品开发的无价之宝，但对于人工智能应用来说，用户反馈作为改进模型的数据源，其作用更为关键。对话式界面让用户更容易提供反馈，但却增加了开发人员提取信号的难度。本章将讨论不同类型的对话式人工智能反馈，以及如何设计一个系统，在不损害用户体验的情况下收集正确的反馈。

人工智能工程架构

一个成熟的人工智能架构可能很复杂。本节将介绍一个团队在生产中可能遵循的流程，从最简单的架构开始，逐步添加更多组件。尽管人工智能应用多种多样，但它们有许多共同的组件。此处提出的架构已在多家公司得到验证，适用于各种应用，但某些应用可能会有偏差。

在最简单的形式中，您的应用程序接收一个查询并将其发送给模型。如图 10-1 所示，模型会生成一个响应，并返回给用户。没有上下文增强、没有防护栏，也没有优化。模型 API框既指第三方 API（如 OpenAI、Google、Anthropic），也指自托管模型。第 9 章将讨论为自托管模型构建推理服务器。

A diagram of a model Description automatically generated

从这个简单的架构出发，您可以根据需要添加更多组件。具体过程如下：

通过让模型访问外部数据源和信息收集工具，增强模型的上下文输入。
设置防护栏，保护系统和用户。
添加模型路由器和网关，以支持复杂的管道并增加安全性。
通过缓存优化延迟和成本。
添加复杂的逻辑和编写操作，最大限度地发挥系统的功能。

本章按照我在生产中常见的流程进行。但是，每个人的需求都不尽相同。您应该遵循对您的应用程序最合理的顺序。

监控和可观察性对于任何应用程序的质量控制和性能改进都是不可或缺的，将在本流程的最后进行讨论。之后将讨论将所有这些组件串联起来的 "协调"（Orchestration）。

步骤 1.增强内涵

平台的初始扩展通常包括添加一些机制，使系统能够构建模型回答每个查询所需的相关上下文。如第 6 章所述，可以通过各种检索机制构建上下文，包括文本检索、图像检索和表格数据检索。还可以使用一些工具对上下文进行扩充，这些工具允许模型通过网络搜索、新闻、天气、事件等 API 自动收集信息。

上下文构建就像基础模型的特征工程。它为模型提供产生输出所需的信息。由于上下文构建在系统输出质量中的核心作用，模型 API 提供商几乎普遍支持上下文构建。例如，OpenAI、Claude 和 Gemini 等提供商允许用户上传文件，并允许其模型使用工具。

然而，就像模型的能力各不相同一样，这些提供商对上下文构建的支持也各不相同。例如，它们可能会限制上传的文件类型和数量。专门的 RAG 解决方案可能会让您上传向量数据库所能容纳的尽可能多的文档，但通用模型 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572267506

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business