book

企业级Java开发中的应用人工智能 (Chinese Edition)

Name: 企业级Java开发中的应用人工智能 (Chinese Edition)
ISBN: 0642572279905

by Alex Soto Bueno, Markus Eisele, Natale Vinto

November 2025

Beginner to intermediate

430 pages

5h 12m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
超越原型：用Java构建具有弹性的AI融合应用本书适合哪些读者本书结构必备知识与软件本书规范代码示例使用规范O'Reilly在线学习联系我们致谢亚历克斯Markus纳塔莱
1. 企业人工智能困境
人工智能格局：技术视角一路走向通用人工智能机器学习：当今人工智能的基础Deep Learning：人工智能武器库中的强大工具生成式人工智能：内容生成的未来开源模型与训练数据开源为何是生成式AI的重要驱动力劣质数据的隐性代价：通过训练输入理解模型行为为LLMs注入企业专属数据可解释且透明的人工智能决策伦理与可持续性考量LLMs的生命周期及其行为调控机制MLOps与DevOps之争（以及AIOps与GenAIOps的崛起）结论
2. 新型应用形态
理解大型语言模型大型语言模型的核心要素模型部署为您的应用选择合适的 LLM模型类型模型规模与效率部署方法支持精度与硬件优化伦理考量与偏见社区与文档支持闭源与开源之争示例分类基础模型与专家模型：发展方向何在？辅助技术的应用嵌入模型与向量数据库缓存与性能优化人工智能代理框架模型上下文协议API集成模型安全、合规与访问控制结论
3. 开发者指南：prompt为何在人工智能应用中至关重要
prompt类型用户prompt：来自用户的直接输入系统 prompt：引导模型行为的指令上下文 prompt：预填充或动态生成的输入有效prompt编写原则prompt技巧零样本 prompt：无上下文提问少样本prompt：提供示例引导响应思维链prompt：鼓励逐步推理自我一致性：通过生成多重响应提升准确性指令式prompt：明确指导模型检索增强生成：通过外部数据增强prompt高级策略动态prompt构建：融合静态与生成输入运用 prompt 链维持上下文连贯性运用防护机制与验证确保输出安全性利用API实现prompt定制性能与成本的优化权衡调试prompt：排查低效响应工具使用与函数调用上下文工程作为新型 prompt 工程为上下文设计内存与存储方案内存缓存实现快速访问热内存实现短期上下文存储基于向量数据库的长期语义记忆冷存储用于归档数据与大型存储库组合存储层级实现高效上下文交付结论
4. 应用程序的人工智能架构
突破传统架构：为何人工智能融合系统需要新思路核心架构支柱概览：本章路线图应用组件查询与数据：管理应用程序输入AI网关：输入与输出管理上下文与记忆交互与传输：工具与代理的应用发现与访问控制模型服务数据准备管道可观测性与监控：端到端AI技术栈结论
5. 嵌入向量、向量存储与本地运行模型
嵌入向量及其作用为何需要嵌入？嵌入向量的结构相似性度量：余弦相似度与距离常见嵌入模型AI应用中如何使用嵌入？其他相似度计算方法嵌入向量的非常规应用向量存储与查询机制向量数据库如何存储与检索嵌入向量常见向量存储示例检索增强生成大规模索引或生成向量嵌入为何本地运行模型？Ollama：基于简易界面的本地推理工具Podman Desktop：利用容器化环境处理AI工作负载Jlama：基于JVM应用的原生Java模型推理本地推理方法对比使用OpenAI的REST APIOpenAI 模型与端点概览使用 OpenAI API 生成嵌入向量结论
6. 推理API
什么是推理API？推理 API 的优势推理API示例在Java中部署推理模型使用DJL进行模型推理深入解析使用gRPC进行模型推理结论
7. 使用Java访问推理模型
使用Quarkus连接推理API体系架构欺诈推理APIQuarkus项目REST客户端接口REST资源测试示例使用Spring Boot WebClient连接推理API添加 WebClient 依赖项使用 WebClient使用Quarkus gRPC客户端连接推理API添加 gRPC 依赖项实现 gRPC 客户端结论
8. LangChain4j
什么是LangChain4j？统一APIprompt模板结构化输出内存数据增强工具高级API使用纯Java实现的LangChain4j从非结构化文本中提取信息执行文本分类生成图像与描述Spring Boot集成添加 Spring Boot 依赖项定义AI服务创建REST控制器Quarkus集成Quarkus 依赖项前端AI服务WebSocket光学字符识别工具依赖项行程持久化等待时间服务人工智能服务REST 端点动态工具工具相关最终说明内存依赖项代码变更结论
9. 向量嵌入与存储
计算向量嵌入使用 DJL 的向量嵌入使用进程内LangChain4j实现向量嵌入使用LangChain4j远程模型实现向量嵌入文本分类器文本分类嵌入依赖项提供示例与输入分类文本聚类添加文本聚类依赖关系阅读头条新闻计算向量嵌入聚类新闻新闻标题摘要生成语义搜索添加语义搜索依赖项导入电影相似性查询语义缓存RAG摄入检索重新排序查询路由器摄取拆分窗口结果过滤结论

10. LangGraph4j
LangGraph4j中的图理解节点边状态使用LangGraph4j定义状态定义节点定义图添加条件边附加值结合LangChain4j使用LangGraph4j路由代理LangGraph4j的人机交互具有自我反思的高级RAG模式探索其他功能子图并行执行时间旅行结论
11. 图像处理
OpenCV初始化库图像加载与保存执行基本变换元素叠加图像处理读取条形码和二维码流处理视频处理处理网络摄像头图像OpenCV与JavaOCR结论
12. 人工智能Java开发的高级主题
流媒体使用低级API进行流媒体传输使用AI服务进行流媒体传输使用LangChain4j和流媒体集成防护栏输入防护栏输出防护栏防护栏使用案例模型上下文协议MCP架构基于 Java 的 MCP 客户端基于Quarkus的MCP客户端基于Quarkus的MCP服务器MCP 的核心优势下一步
索引
关于作者

Content preview from 企业级Java开发中的应用人工智能 (Chinese Edition)

第6章推理API

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

您已通过扩展了对人工智能及各类模型的认知。此外，您还（在可能的情况下）在本地部署了这些模型，并通过查询进行了测试。但当需要实际使用模型时，您必须正确暴露模型，遵循组织的最佳实践，并为开发人员提供便捷的模型使用方式。

推理API可解决这些问题，使所有开发人员都能访问模型。本章将探讨如何通过Java中的推理API公开AI/ML模型。

什么是推理API？

推理API允许 开发者通过任意协议（如HTTP、gRPC或Kafka）向部署了机器学习模型的服务器发送数据，并接收预测结果或分类结果。实际上，每次访问OpenAI、Gemini等云端模型或使用Ollama部署的本地模型时，都是通过其推理API实现的。

尽管如今使用谷歌、IBM或Meta等巨头训练的大型模型（主要用于LLM）已很普遍，但您可能仍需借助小型定制模型解决特定业务难题。这类模型通常由企业内部数据科学家开发，您必须编写代码才能进行推理.

例如，假设你在银行工作，数据科学家训练了一个定制模型来检测信用卡交易是否属于欺诈。该模型是ONNX格式的预测性AI模型，包含六个输入参数和一个float 类型的输出参数。

输入参数如下：

distance_from_last_transaction: 距最近交易发生的时间间隔。例如：0.3111400080477545。
ratio_to_median_price: 购买价格交易额与中位数购买价格之比。例如：1.9459399775518593。
used_chip: 指示交易是否通过芯片完成：true 时为1.0，false 时为0.0。
used_pin_number: 表示交易是否使用PIN码：true 则为1.0，false 则为0.0。
online_order: 表示交易是否为在线订单：true 则为1.0，false 则为0.0。

输出参数如下：

prediction: 交易欺诈概率。例如：0.9625362。

您可能注意到以下细节：

所有数据均为浮点数，即使在used_chip 字段中表示布尔值时也是如此。
输出结果为概率值，但从业务角度看，您需要明确欺诈是否发生。
开发人员更倾向于使用类而非多个参数。

这是创建模型推理API的典型场景，通过添加抽象层简化模型调用流程。

图6-1展示了JSON文档与模型参数之间的转换过程，用于创建推理API 。

Diagram illustrating the transformation of a JSON document into model parameters through the inference API, highlighting fields such as distance from the last transaction and online order status.

推理API的优势

推理 API 的优势包括：

模型具备高度可扩展性。由于每个模型都暴露无状态的标准API，您可像管理其他服务那样灵活扩展或缩减其规模。
集成过程简单明了；API采用REST、Kafka或gRPC等成熟协议。
API 提供抽象层，可在此引入安全防护、监控、日志记录及其他横切关注点。

既然您已了解推理API的价值所在，接下来让我们探索几个可立即使用的示例。

推理API示例

开源（及商业）工具均提供推理API，支持任意应用调用模型。多数情况下，模型通过格式规范的REST API对外暴露。应用仅需REST客户端即可与模型交互。

当前两大主流推理API或将成为LLM领域的标准API。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572279905

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills