February 2026
Intermediate to advanced
406 pages
4h 57m
Chinese
在探讨了如何在Kubernetes上运行LLMs进行推理和调优后,我们将视角从单一模型服务转向构建完整的AI驱动应用程序。 LLM服务很少独立运行:它们通常集成于更庞大的系统中,该系统协调对话界面、用于上下文检索的向量数据库以及生成式模型服务之间的流程。
本部分首先阐述AI驱动应用的架构模式——从聊天界面到事件驱动后端,并引入检索增强生成(RAG)技术以将模型输出锚定于外部知识,同时探讨智能体工作流中LLMs如何协调工具调用与多步推理。 从架构转向运维,我们将探讨智能体系统特有的生产挑战:安全性、状态管理、可观测性、成本控制及可靠性,同时介绍标准化工具与智能体通信的协议,如模型上下文协议(MCP)和智能体间通信协议(A2A)。
本部分各章节具体涵盖以下内容:
第8章《AI驱动应用》阐述了聊天、事件驱动和批处理等AI应用的架构模式,并深入探讨了RAG与智能体工作流。
第9章《生产环境中的代理应用运行》运用MCP和A2A协议,解决生产环境中的安全、状态、可观测性、成本及可靠性挑战。
Read now
Unlock full access