book

向量数据库 (Chinese Edition)

Name: 向量数据库 (Chinese Edition)
Author: Nitin Borwankar
ISBN: 0642572369859

by Nitin Borwankar

April 2026

Intermediate

292 pages

3h 58m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
本书内容本书适合哪些读者如何使用本书软件、环境与资源要求本书采用的约定代码示例的使用O’Reilly 在线学习联系我们致谢
1. 向量数据库简介
为何需要向量数据库？一种新的数据类型：向量相似性搜索向量类型有何不同？向量数据库适用于哪些场景？SQL 与向量数据库的对比商业数学的基础：会计算术关系型数据库管理系统中的向量表示对向量专用功能的需求NoSQL 与向量数据库NoSQL 数据库与向量存储NoSQL 数据库中向量扩展的局限性何时选择带向量扩展的 NoSQL混合方法：结构化数据与向量数据的结合对向量数据与元数据的双重需求纯向量存储的局限性混合数据库架构混合查询示例混合方法的优势结论
2. 嵌入
理解向量嵌入：我们为何需要它们Word2Vec：改变一切的突破Doc2Vec：从单词到文档从嵌入到现代语言模型：Transformer 的关联仅编码器变压器（BERT及其变体）仅解码器Transformer（GPT系列）编码器-解码器 Transformer（T5、BART）嵌入模型：专业的向量生成器与传统模型的区别在现代LLM应用中的作用实际应用与用例简易 RAG 管道SentenceTransformers 库：文本嵌入领域的瑞士军刀使用 SentenceTransformers 的最佳实践：详解指南嵌入层：零样本学习的门户Transformer 嵌入的结构解析与零样本学习的关联支持零样本学习的关键特性局限性与注意事项最新进展与趋势使用 Word2Vec 进行向量运算：实践指南步骤 1：环境搭建与安装步骤 2：加载预训练的 Word2Vec 模型步骤 3：实现向量运算函数步骤 4：经典的国王-王后类比步骤 5：更多有趣的类比第 6 步：交互式探索工具关于向量算术的总结结论
3. 使用 FAISS 进行相似度搜索
基础知识向量表示法距离度量选择启发式FAISS 索引平面索引（暴力法）基于IVF的索引基于 LSH 的索引基于 HNSW 的索引其他专用索引复合索引与转换索引如何选择合适的指数量化SQPQANN 问题问题避免计算成本FAISS中的关键ANN技术在 FAISS 中选择索引代码示例理解 HNSW 索引什么是 HNSW？HNSW的工作原理关键参数解析实践示例：构建相似度搜索系统性能特征最佳实践FAISS 架构与组件基础知识核心概念关键组件常见工作流示例说明关键要点深入探索结论
4. 基于 SQLite3 的语义搜索
理解 SQLite 向量相似度搜索扩展核心功能架构概述限制搭建开发环境安装依赖项验证安装操作建议设计数据库模式模式要求表定义模式设计决策使用 Python Reddit API 封装库连接 Reddit创建 Reddit API 凭据PRAW 客户端实现使用示例内容提取与预处理文本清洗管道质量过滤生成与存储嵌入向量嵌入生成器数据库存储批处理管道构建向量索引了解 VSS 索引索引管理实现语义搜索搜索结果容器搜索引擎整合所有功能工作流示例输出示例扩展：增量索引结论
5. 使用 PostgreSQL pgvector 构建 ArXiv 论文检索系统
科学文献检索的挑战为何 ArXiv 是理想的数据源实际应用案例技术栈设计依据架构概述系统组件数据流设计理念环境配置与依赖项PostgreSQL 和 pgvector 安装Python 环境配置目录结构与配置验证与测试科学论文的数据库设计模式设计原则核心表结构向量存储策略索引策略ArXiv 集成与 PDF 管理ArXiv API 客户端实现PDF 下载管道批处理系统PDF文本提取与处理PDF 提取的挑战智能文本分块嵌入式生成与存储嵌入式模型策略批处理管道相似度搜索实现交互式应用程序与用户界面用于本地部署的 Docker 打包容器架构Docker Compose 配置数据库初始化脚本开发工作流Cloud就绪设计基础性能调优索引配置查询性能资源管理后续步骤当前限制改进建议我们做了什么系统成就所掌握的技术技能实用的研究工具高级系统的基础未来潜力结论
6. 使用 SQLite VSS 和 Ollama 构建检索增强生成系统
系统架构概述支持向量的数据库基础架构配置向量支持型数据库RAG的模式设计创建搜索索引文本处理与嵌入向量生成嵌入式模型管理智能文本分块使用嵌入向量存储内容混合搜索实现混合搜索算法语义搜索组件关键词搜索组件评分融合与排序与Ollama集成的LLMOllama API 客户端健康检查功能RAG 管道上下文格式化问答处理流程演示与测试示例数据加载主要演示功能交互式问答界面快速测试工具下一步：扩展系统缺失的Reddit数据特征性能优化生产环境注意事项高级 RAG 模式结论
7. 使用 PostgreSQL 和 pgvector 构建科学 RAG 系统
系统目标与功能架构概述基于 pgvector 的数据库基础架构数据库配置与设置科学论文的模式设计高性能向量索引嵌入式生成策略ArXiv 集成与 PDF 处理利用 ArXiv API 发现论文智能PDF文本提取高级文本分块基于嵌入向量的存储管道多层次语义搜索摘要级搜索章节级搜索RAG 管道：深度解析通过 Ollama 集成本地 LLM健康检查与模型发现智能上下文检索科学提示工程完整的RAG执行管道演示与交互式界面主要演示流程搜索演示RAG 演示交互式搜索界面带模式选择的入口点关于 HNSW 的技术说明如何评估搜索结果下一步：扩展科学RAG系统结论
8. 构建完整的对话搜索与 RAG 系统
系统目标与功能系统架构概述我们将共同构建的内容对话存储的数据库基础对话模式设计实现最佳性能的三表架构高性能向量索引对话导入与数据处理管道带错误处理的健壮 JSON 导入原子事务处理时间戳处理与数据验证错误恢复与日志记录高效的嵌入向量生成与批量处理用于模型管理的单例模式增量处理策略为实现最佳性能而进行的批处理带冲突处理的数据库插入基于对话理解的上下文搜索语义相似度搜索多表连接以实现丰富的上下文结果格式与结构对话上下文检索上下文窗口计算RAG 集成用于对话历史记录结构化上下文管理通过 Ollama 集成本地 LLM健康监测与模型发现上下文检索与组装对话式 prompt 工程带性能监控的完整 RAG 管道基于 FastAPI 的完整 Web APIFastAPI 应用架构带验证的模型请求搜索端点实现RAG 问答端点系统统计与监控服务器启动与配置演示与示例数据生成逼真的样本数据多主题样本覆盖样本数据处理管道全面系统演示渐进式功能演示带条件执行的RAG演示生产环境导入功能应用程序入口点结论：一个完整的个人知识系统
9. 向量查询语言
核心概念数据模型基本语法结构向量运算相似度搜索混合搜索范围搜索批处理操作向量函数与聚合向量函数向量聚合

目录
关于作者

Content preview from 向量数据库 (Chinese Edition)

第 6 章. 使用SQLite VSS 和 Ollama构建检索增强生成系统

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在前几章中，我们重点探讨了向量搜索的各个组成部分：创建嵌入向量和执行相似度查询。现在，是时候将这些组件整合成一个可运行的检索增强生成（RAG）系统了。

与依赖分布式 Cloud 集群的生产级 Web 应用不同，我们的目标是构建一个高性能、私有且完全本地化的 RAG 系统，使其能在单台桌面电脑上运行。我们将使用 SQLite VSS 作为搜索引擎，并采用 Ollama 作为本地 LLM“大脑”。

RAG系统解决了LLMs的一个根本性局限：其知识在训练时便已固化，无法获取私有或最新信息。通过为LLMs增强检索机制，我们构建了一个能够利用最新、领域特定知识来回答问题的系统。

我们的目标是构建一个能够智能响应关于Reddit内容查询的问答系统。当用户提出问题时，系统将：(1) 搜索存储的Reddit帖子以查找最相关信息；(2) 检索最匹配的内容片段；(3) 将此上下文提供给LLM；(4) 仅基于检索到的信息生成自然语言答案。

这种方法通过将LLM的回答锚定在实际数据上，确保了事实准确性，显著减少了（尽管未能完全消除）幻觉现象，并使系统能够处理LLM训练数据中未包含的私有或专业内容。

系统架构概述

我们的 RAG 系统由五个协同工作的主要组件构成：

向量数据库层（SQLite VSS）: 将内容片段与其嵌入向量一同存储，从而实现快速相似度搜索
嵌入式引擎（SentenceTransformers）: 将文本转换为能够捕捉语义含义的密集向量表示
混合搜索系统: 将语义向量搜索与传统关键词搜索相结合，实现最优检索
LLM集成（Ollama）: 提供本地 LLM 推理以生成自然语言响应
RAG 管道协调器: 协调检索与生成流程

数据流遵循以下路径：内容摄取 → 文本分块 → 嵌入向量生成 → 向量存储 → 查询处理 → 混合搜索 → 上下文检索 → prompt构建 → LLM生成。参见图6-1。

Diagram showing the system architecture with components for content ingestion, embedding, storage, search, and LLM integration, illustrating the data flow through ingestion and query processes.

让我们逐步构建每个组件。

支持向量搜索的数据库基础

首先，我们需要搭建数据库基础设施。我们使用带 VSS 扩展的 SQLite，该扩展为 SQLite 增添了向量搜索功能。这为我们提供了一个轻量级的嵌入式解决方案，非常适合 RAG 应用：

# Chapter 6: Minimal RAG System with SQLite VSS and Ollama
# Simplified version demonstrating core retrieval-augmented generation
import sqlite3
import ollama
import requests
import json
import time
import hashlib
from sentence_transformers import SentenceTransformer
from typing import List, Dict, Optional

导入语句揭示了我们的技术栈：SQLite 用于存储，requests 用于调用 Ollama ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572369859

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business