Skip to Content
变形金刚权威指南 (Chinese Edition)
book

变形金刚权威指南 (Chinese Edition)

by Nicole Koenigstein
March 2026
Intermediate
372 pages
4h 53m
Chinese
O'Reilly Media, Inc.
Content preview from 变形金刚权威指南 (Chinese Edition)

第9章 从 脚本到思考: 用于复杂任务的AI代理

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

传统的 工作流就像排练得非常到位的戏剧:动作顺序是固定的,演员恪守台词,结局也是预先确定的。代理系统打破了这种模式。相比之下,代理是即兴表演者。它们可以决定接下来演哪一幕,随时调整台词,甚至邀请新的演员登台。 即兴表演中有“Yes, and…”(“是的,并且……”)法则:接受现有内容并加以补充,从而推动故事发展。用人工智能术语来说,即:Yes → 接受当前状态、上下文或来自其他智能体或工具的贡献,而不将其舍弃;and → 在此基础上,通过添加推理、行动或新信息来推动任务进展。 代理系统不再沿着笔直且僵化的路线前进,而是循环往复地进行规划、行动和自我修正。这种从预定义脚本向自适应、协作式决策的转变,正是人工智能代理自主性的核心所在。表9-1对比了的两种工作流。

表 9-1. 传统工作流与代理工作流的对比
传统工作流程 代理系统

预定义序列

动态决策循环

灵活性有限

具备上下文感知能力,可使用工具

线性执行

迭代、自修正

不适应反馈

根据反馈调整计划

固定工具集

根据需要选择并组合工具

单次通过完成

可回溯并优化前期步骤

静态目标解读

可根据不断变化的上下文重新解释目标

在接下来的章节中,您将探讨当今自主性的含义、其局限性,以及如何利用 LangGraph 和 SWE-agent 等框架设计能够实时规划、行动并提升性能的智能体。您还将了解为何“人机协同”监督是智能体工作流中至关重要的保障机制——它确保了目标一致性和信任度,并了解上下文工程如何在恰当的时刻动态地为智能体提供正确的信息。

自主性:当前的实现可能性

当今的 代理系统虽远未达到科幻小说中那种完全通用、自主的智能水平,但它们已经展现出可部署于现实工作流中的实用型自主能力。代理工作流将LLMs与协调逻辑及工具相结合,使代理能够在模块化、状态驱动的工作流中运行,而非受限于僵化的脚本。 它们能够选择工具、根据条件路由任务(例如“若反思失败,则调用重试代理”),并根据中间结果调整下一步行动。尽管仍受限于prompt、可用工具及框架约束,此类代理正日益展现出做出情境感知决策、自我修正以及与其他代理协作的能力。

然而,这种自主性是“协调”而非自由形式的:控制流虽预先定义,但在该结构内,代理可在多条路径中进行选择,调用不同工具,修订自身prompt或工具集,甚至编写并运行代码以确定后续步骤。 例如,检索增强生成(RAG) 总是在调用 LLM 前检索文档,但代理架构允许 LLM 自行决定控制流。这意味着代理可以:

  • 在潜在执行路径之间进行路由。

  • 决定调用众多工具中的哪一个

  • 判断其输出是否足够,还是需要进一步处理

此外,不同的架构赋予LLM不同程度的控制权。最简单的类型是路由器,它仅从预定义选项中做出单一决策。更先进的设计,如工具调用代理,则支持多步骤决策、记忆、反思和规划。 工具调用使代理能够通过定义好的模式与外部系统交互;内存使其能够在不同步骤或会话间保留并复用信息;而规划则使 LLM 能够迭代地决定最佳下一步行动,直至达成目标。LangGraph 等框架通过支持子图、人机协同干预、反思和并行化进一步扩展了这些功能,从而实现了模块化、专业化和协作性的工作流。

当今的系统通常更接近该光谱中的“路由器”端,即LLM仅在预定义的有限选项范围内做出有限决策,例如调用哪个工具或遵循工作流的哪个分支。能够生成、执行并调整多步骤计划且无需固定协调机制的完全自主代理,目前仍是一个研究目标,而非实际应用中的现实。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

LLM 网格 (Chinese Edition)

LLM 网格 (Chinese Edition)

Kurt Muehmel

Publisher Resources

ISBN: 0642572364274