Skip to Content
企业级Java开发中的应用人工智能 (Chinese Edition)
book

企业级Java开发中的应用人工智能 (Chinese Edition)

by Alex Soto Bueno, Markus Eisele, Natale Vinto
November 2025
Beginner to intermediate
430 pages
5h 12m
Chinese
O'Reilly Media, Inc.
Content preview from 企业级Java开发中的应用人工智能 (Chinese Edition)

第五章 嵌入 向量、向量存储库与本地模型运行

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

本章将介绍构成几乎所有人工智能应用基础的三个核心概念:嵌入向量、向量存储库,以及它们在检索增强生成架构中与增强查询的结合。我们还将深入探讨本地模型推理技术,重点聚焦于本地LLMs的实际应用,以及如何通过基于Java的工具和框架与之交互。对于开发者而言,这对于将人工智能能力有效集成到本地机器的应用程序至关重要。

您将学习:- 嵌入如何从原始输入中提取语义含义- 向量存储如何实现高效相似性检索- 这些组件如何与LLMs协同工作,驱动语义搜索、分类和长上下文记忆等功能重点在于为满足性能、成本、隐私或离线需求,在本地运行这些功能。

本基础章节为后续实践操作奠定基础,深入解析嵌入向量与本地推理的关联机制,助您在后续章节中自信地将其应用于Java应用程序。

嵌入向量及其作用

在 之前,LLMs需要一种解读数据的方式才能进行推理。它们通过数字实现这一目标,因此我们需要探讨嵌入向量。本节将阐释嵌入的本质、重要性及其如何赋能语义搜索、推荐系统、分类和对话记忆等任务。

我们将从动机切入:解析为何关键词搜索等传统方法力有未逮,以及嵌入技术如何通过以稠密数学格式捕捉音节与语义双重信息来解决这一问题。随后您将探索嵌入向量的结构,并学习如何运用余弦相似度、点积等相似度度量进行向量比较。

继而我们将系统梳理常见嵌入模型——从Word2Vec、全局词向量表示(GloVE)到双向编码器表示(BERT)变体及句级模型。通过解析模型能力差异,帮助您明确不同场景下的适用选择。您还将学习如何评估模型兼容性,包括在将嵌入与 LLMs 配对时需考虑的因素:分词方案、嵌入维度及架构设计等.

本节后半部分聚焦实际应用场景。我们将演示如何运用嵌入技术实现聚类分析、分类识别、个性化服务、异常检测,乃至对话上下文维护。您还将看到嵌入技术如何通过创新组合与分析实现概念漂移检测、语义演变追踪及抽象概念表征。

完成本节学习后,您将掌握嵌入技术的运作原理、在Java环境中的高效应用方法,以及其在本书所呈现的更广泛AI技术栈中的衔接关系.

为何需要嵌入技术?

传统的基于关键词的 搜索或one-hot编码方法无法捕捉相似词汇或概念之间的关联性。嵌入技术通过在向量空间中将语义相近的元素置于更接近的位置来解决这一问题。

例如:

  • "car"和"automobile"应具有相似的向量表示。

  • 词语“king”和“queen”应能保留关系属性,例如: king – man + woman ≈ queen。

基于嵌入向量的检索系统能根据语义而非精确关键词匹配,查找相似文档、常见问题或产品。传统搜索方法仅比较关键词,当用户使用不同词汇或短语时常遗漏相关结果。嵌入技术通过将文本转化为数值表示,使搜索能衡量语义相似性而非单纯文本匹配,从而返回更相关的内容。

聊天机器人和RAG系统依赖嵌入技术获取响应所需的相关信息。与将用户查询与预设答案匹配不同,嵌入技术能帮助系统从知识库中识别最相关的上下文。这种方法使聊天机器人能更有效地理解用户意图,并基于存储知识而非简单模式匹配提供响应。

嵌入技术还支持分类与聚类 ,通过聚合相似项并检测异常值实现智能分组。模型无需人工标注数据,即可分析嵌入向量识别模式并分类内容。该技术在垃圾邮件检测、主题分类和欺诈识别等任务中尤为关键——数据模式的细微差异往往蕴含重要区分特征。

推荐系统通过嵌入技术分析用户偏好来推送相关商品。将用户行为与商品特征转化为数值向量后,推荐机制便基于相似性而非显式规则运行。这种方法聚焦用户与商品间的内在关联,显著提升了电商平台、流媒体服务及其他个性化平台的内容推荐精度。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

产品思维工程师 (Chinese Edition)

产品思维工程师 (Chinese Edition)

Drew Hoskins

Publisher Resources

ISBN: 0642572279905