book

企业级Java开发中的应用人工智能 (Chinese Edition)

Name: 企业级Java开发中的应用人工智能 (Chinese Edition)
ISBN: 0642572279905

by Alex Soto Bueno, Markus Eisele, Natale Vinto

November 2025

Beginner to intermediate

430 pages

5h 12m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
超越原型：用Java构建具有弹性的AI融合应用本书适合哪些读者本书结构必备知识与软件本书规范代码示例使用规范O'Reilly在线学习联系我们致谢亚历克斯Markus纳塔莱
1. 企业人工智能困境
人工智能格局：技术视角一路走向通用人工智能机器学习：当今人工智能的基础Deep Learning：人工智能武器库中的强大工具生成式人工智能：内容生成的未来开源模型与训练数据开源为何是生成式AI的重要驱动力劣质数据的隐性代价：通过训练输入理解模型行为为LLMs注入企业专属数据可解释且透明的人工智能决策伦理与可持续性考量LLMs的生命周期及其行为调控机制MLOps与DevOps之争（以及AIOps与GenAIOps的崛起）结论
2. 新型应用形态
理解大型语言模型大型语言模型的核心要素模型部署为您的应用选择合适的 LLM模型类型模型规模与效率部署方法支持精度与硬件优化伦理考量与偏见社区与文档支持闭源与开源之争示例分类基础模型与专家模型：发展方向何在？辅助技术的应用嵌入模型与向量数据库缓存与性能优化人工智能代理框架模型上下文协议API集成模型安全、合规与访问控制结论
3. 开发者指南：prompt为何在人工智能应用中至关重要
prompt类型用户prompt：来自用户的直接输入系统 prompt：引导模型行为的指令上下文 prompt：预填充或动态生成的输入有效prompt编写原则prompt技巧零样本 prompt：无上下文提问少样本prompt：提供示例引导响应思维链prompt：鼓励逐步推理自我一致性：通过生成多重响应提升准确性指令式prompt：明确指导模型检索增强生成：通过外部数据增强prompt高级策略动态prompt构建：融合静态与生成输入运用 prompt 链维持上下文连贯性运用防护机制与验证确保输出安全性利用API实现prompt定制性能与成本的优化权衡调试prompt：排查低效响应工具使用与函数调用上下文工程作为新型 prompt 工程为上下文设计内存与存储方案内存缓存实现快速访问热内存实现短期上下文存储基于向量数据库的长期语义记忆冷存储用于归档数据与大型存储库组合存储层级实现高效上下文交付结论
4. 应用程序的人工智能架构
突破传统架构：为何人工智能融合系统需要新思路核心架构支柱概览：本章路线图应用组件查询与数据：管理应用程序输入AI网关：输入与输出管理上下文与记忆交互与传输：工具与代理的应用发现与访问控制模型服务数据准备管道可观测性与监控：端到端AI技术栈结论
5. 嵌入向量、向量存储与本地运行模型
嵌入向量及其作用为何需要嵌入？嵌入向量的结构相似性度量：余弦相似度与距离常见嵌入模型AI应用中如何使用嵌入？其他相似度计算方法嵌入向量的非常规应用向量存储与查询机制向量数据库如何存储与检索嵌入向量常见向量存储示例检索增强生成大规模索引或生成向量嵌入为何本地运行模型？Ollama：基于简易界面的本地推理工具Podman Desktop：利用容器化环境处理AI工作负载Jlama：基于JVM应用的原生Java模型推理本地推理方法对比使用OpenAI的REST APIOpenAI 模型与端点概览使用 OpenAI API 生成嵌入向量结论
6. 推理API
什么是推理API？推理 API 的优势推理API示例在Java中部署推理模型使用DJL进行模型推理深入解析使用gRPC进行模型推理结论
7. 使用Java访问推理模型
使用Quarkus连接推理API体系架构欺诈推理APIQuarkus项目REST客户端接口REST资源测试示例使用Spring Boot WebClient连接推理API添加 WebClient 依赖项使用 WebClient使用Quarkus gRPC客户端连接推理API添加 gRPC 依赖项实现 gRPC 客户端结论
8. LangChain4j
什么是LangChain4j？统一APIprompt模板结构化输出内存数据增强工具高级API使用纯Java实现的LangChain4j从非结构化文本中提取信息执行文本分类生成图像与描述Spring Boot集成添加 Spring Boot 依赖项定义AI服务创建REST控制器Quarkus集成Quarkus 依赖项前端AI服务WebSocket光学字符识别工具依赖项行程持久化等待时间服务人工智能服务REST 端点动态工具工具相关最终说明内存依赖项代码变更结论
9. 向量嵌入与存储
计算向量嵌入使用 DJL 的向量嵌入使用进程内LangChain4j实现向量嵌入使用LangChain4j远程模型实现向量嵌入文本分类器文本分类嵌入依赖项提供示例与输入分类文本聚类添加文本聚类依赖关系阅读头条新闻计算向量嵌入聚类新闻新闻标题摘要生成语义搜索添加语义搜索依赖项导入电影相似性查询语义缓存RAG摄入检索重新排序查询路由器摄取拆分窗口结果过滤结论

10. LangGraph4j
LangGraph4j中的图理解节点边状态使用LangGraph4j定义状态定义节点定义图添加条件边附加值结合LangChain4j使用LangGraph4j路由代理LangGraph4j的人机交互具有自我反思的高级RAG模式探索其他功能子图并行执行时间旅行结论
11. 图像处理
OpenCV初始化库图像加载与保存执行基本变换元素叠加图像处理读取条形码和二维码流处理视频处理处理网络摄像头图像OpenCV与JavaOCR结论
12. 人工智能Java开发的高级主题
流媒体使用低级API进行流媒体传输使用AI服务进行流媒体传输使用LangChain4j和流媒体集成防护栏输入防护栏输出防护栏防护栏使用案例模型上下文协议MCP架构基于 Java 的 MCP 客户端基于Quarkus的MCP客户端基于Quarkus的MCP服务器MCP 的核心优势下一步
索引
关于作者

Content preview from 企业级Java开发中的应用人工智能 (Chinese Edition)

第12章. 人工智能Java开发的高级主题

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

正如前几章所述，借助LangChain4j和LangGraph4j等工具，Java人工智能应用开发领域已发生显著变革。至此，您已成功构建智能聊天机器人、探索向量存储库、编排人工智能工作流，甚至将图像识别功能集成到应用程序中。但当我们迈向生产级、安全且具有可扩展性的人工智能系统时，您需要进一步探索若干高级主题。

本章将提供关键工具，助您将AI应用从功能原型提升为稳健的企业级解决方案。后续内容将深入探讨三大核心能力：

流处理: 应用程序在模型生成响应时即可逐步接收结果，无需等待模型生成完整响应。
防护栏: 您可通过这些防护机制验证LLM的输入/输出是否符合需求。
模型上下文协议: 该开放标准定义了应用程序与语言模型的交互方式——特别是围绕上下文管理、工具和内存的交互机制。

每项特性都将强化质量、弹性与可维护性——现代AI应用的核心支柱。让我们通过LangChain4j掌握这些技术，为您的Java AI解决方案打造未来保障。

流式处理

LLMs（）以增量方式（逐个令牌）生成文本；因此，多数模型供应商支持实时流式响应，而非强制用户等待完整生成。

这能创造更流畅的体验，用户几乎可以即时开始阅读输出内容，而非面临不可预测的延迟。这是实现聊天机器人并为用户提供快速反馈的便捷方式。

让我们使用 LangChain4j 低级 API 实现响应流式传输的第一个示例。

基于低级API的流式传输

您首先会注意到的变更点在于：使用dev.langchain4j.model.chat.Stream⁠ingChatModel 接口替代了ChatModel 接口。创建 StreamingChatModel实例时，需添加模型依赖项并使用具体构建器，其代码与ChatModel 实例类似。例如针对OpenAI，我们使用dev.langchain4j.model.openai.OpenAiStreamingChatModel 类：

StreamingChatModel model = OpenAiStreamingChatModel.builder() 
 .apiKey("demo")
 .baseUrl("http://langchain4j.dev/demo/openai/v1")
 .modelName("gpt-4o-mini")
.build();

: 使用流式构建器

该接口同样包含chat 方法，但在此情况下，它额外包含一个处理LLM流式响应的处理器参数。该处理器遵循dev.langchain4j.model.chat.response.StreamingCha⁠tRespon⁠seHan⁠dler 接口，包含三个在处理流程不同阶段调用的方法。您需要为所有这些方法提供实现。

具体方法如下：

onPartialResponse: 每次模型生成部分响应时调用（通常为单个令牌）
onCompleteResponse ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572279905

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design