book

벡터 데이터베이스 (Korean Edition)

Name: 벡터 데이터베이스 (Korean Edition)
Author: Nitin Borwankar
ISBN: 0642572369835

by Nitin Borwankar

April 2026

Intermediate

292 pages

4h 39m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
이 책의 내용이 책의 대상 독자이 책의 활용 방법소프트웨어, 환경 및 리소스 요구 사항이 책에서 사용하는 표기법코드 예제 활용O’Reilly 온라인 학습문의 방법감사의 말
1. 벡터 데이터베이스 소개
벡터 데이터베이스가 필요한 이유는 무엇인가?새로운 데이터 유형: 벡터유사도 검색벡터 데이터 유형의 특징은 무엇인가?벡터 데이터베이스는 어디에 사용하나요?SQL 대 벡터 데이터베이스비즈니스 수학의 기초: 회계 산술관계형 데이터베이스 관리 시스템에서의 벡터 표현벡터 전용 기능의 필요성NoSQL 대 벡터 데이터베이스NoSQL 데이터베이스와 벡터 저장NoSQL 데이터베이스에서 벡터 확장 기능의 한계벡터 확장이 적용된 NoSQL을 선택해야 할 때하이브리드 접근법: 구조화된 데이터와 벡터 데이터의 결합벡터 데이터와 메타데이터 모두의 필요성순수 벡터 스토리지의 한계하이브리드 데이터베이스 아키텍처하이브리드 쿼리의 예하이브리드 접근 방식의 장점결론
2. 임베딩
벡터 임베딩 이해: 왜 필요한가Word2Vec: 모든 것을 바꾼 획기적인 발전Doc2Vec: 단어에서 문서로임베딩에서 최신 언어 모델까지: 트랜스포머의 연결인코더 전용 트랜스포머(BERT 및 그 변형 모델)디코더 전용 트랜스포머 (GPT 계열)인코더-디코더 트랜스포머 (T5, BART)임베딩 모델: 특화된 벡터 생성기기존 모델과의 차이점현대 LLM 애플리케이션에서의 역할실용적 응용 및 사용 사례간단한 RAG 파이프라인SentenceTransformers 라이브러리: 텍스트 임베딩의 만능 도구SentenceTransformers 사용을 위한 모범 사례: 상세 가이드임베딩 레이어: 제로샷 학습으로 가는 관문트랜스포머 임베딩의 구조제로샷 학습과의 연관성제로샷 학습을 가능하게 하는 주요 특징한계 및 고려 사항최신 동향 및 발전Word2Vec을 활용한 벡터 연산: 실습 가이드1단계: 설정 및 설치2단계: 사전 학습된 Word2Vec 모델 불러오기3단계: 벡터 연산 함수 구현4단계: 고전적인 왕-여왕 비유5단계: 더 흥미로운 유추6단계: 대화형 탐색 도구벡터 산술에 대한 마무리결론
3. FAISS를 이용한 유사도 검색
기초벡터 표현거리 측정법선택 휴리스틱FAISS 인덱스플랫 인덱스 (무차별 대입법)IVF 기반 인덱스LSH 기반 인덱스HNSW 기반 인덱스기타 특수 인덱스복합 및 변환 인덱스적합한 지수 선택양자화SQPQANN 문제문제점계산 비용 절감FAISS의 주요 ANN 기법FAISS에서 인덱스 선택코드 예제HNSW 인덱스 이해HNSW란 무엇인가?HNSW의 작동 원리주요 매개변수 설명실전 예제: 유사도 검색 시스템 구축성능 특성모범 사례FAISS 아키텍처 및 구성 요소기초핵심 개념주요 구성 요소일반적인 워크플로예시주요 내용심화 학습결론
4. SQLite3를 이용한 시맨틱 검색
SQLite 벡터 유사도 검색 확장 기능 이해핵심 기능아키텍처 개요제한 사항개발 환경 설정종속성 설치설치 확인운영 관련 지침데이터베이스 스키마 설계스키마 요구 사항테이블 정의스키마 설계 결정 사항Python Reddit API 래퍼를 사용하여 Reddit에 연결하기Reddit API 자격 증명 생성PRAW 클라이언트 구현사용 예시콘텐츠 추출 및 전처리텍스트 정리 파이프라인품질 필터링임베딩 생성 및 저장임베딩 생성기데이터베이스 저장배치 처리 파이프라인벡터 인덱스 구축VSS 인덱싱 이해인덱스 관리시맨틱 검색 구현검색 결과 컨테이너검색 엔진모든 요소 통합워크플로 예시출력 예시확장: 증분 인덱싱결론
5. PostgreSQL pgvector를 활용한 ArXiv 논문 검색 시스템 구축
과학 문헌 검색의 과제ArXiv가 이상적인 데이터 소스인 이유실제 사용 사례기술 스택 선정 근거아키텍처 개요시스템 구성 요소데이터 흐름설계 철학환경 설정 및 종속성PostgreSQL 및 pgvector 설치Python 환경 설정디렉터리 구조 및 구성검증 및 테스트과학 논문을 위한 데이터베이스 설계스키마 설계 원칙핵심 테이블 구조벡터 저장 전략인덱싱 전략ArXiv 통합 및 PDF 관리ArXiv API 클라이언트 구현PDF 다운로드 파이프라인배치 처리 시스템PDF 텍스트 추출 및 처리PDF 추출의 과제지능형 텍스트 청크 분할임베딩 생성 및 저장임베딩 모델 전략배치 처리 파이프라인유사도 검색 구현대화형 애플리케이션 및 UI로컬 배포를 위한 Docker 패키징컨테이너 아키텍처Docker Compose 구성데이터베이스 초기화 스크립트개발 워크플로Cloud 지원 설계기본 성능 튜닝인덱스 구성쿼리 성능리소스 관리다음 단계현재의 제한 사항개선 제안수행 내용시스템 성과습득한 기술 역량실용적인 연구 도구고급 시스템의 기반미래의 잠재력결론
6. SQLite VSS와 Ollama를 활용한 검색 강화 생성(RAG) 시스템 구축
시스템 아키텍처 개요벡터 지원이 포함된 데이터베이스 기반벡터 지원 데이터베이스 구축RAG를 위한 스키마 설계검색 인덱스 생성텍스트 처리 및 임베딩 생성임베딩 모델 관리지능형 텍스트 청크 분할임베딩을 활용한 콘텐츠 저장하이브리드 검색 구현하이브리드 검색 알고리즘시맨틱 검색 구성 요소키워드 검색 컴포넌트점수 통합 및 순위 지정Ollama를 활용한 LLM 통합Ollama API 클라이언트상태 점검 기능RAG 파이프라인컨텍스트 서식 지정질문-답변 파이프라인시연 및 테스트샘플 데이터 로딩주요 데모 기능대화형 Q&A 인터페이스빠른 테스트 유틸리티다음 단계: 시스템 확장Reddit 데이터의 누락된 특징성능 최적화실전 적용 시 고려 사항고급 RAG 패턴결론
7. PostgreSQL 및 pgvector를 활용한 과학적 RAG 시스템 구축
시스템 목표 및 기능아키텍처 개요pgvector를 활용한 데이터베이스 기반데이터베이스 구성 및 설정과학 논문을 위한 스키마 설계고성능 벡터 인덱스임베딩 생성 전략ArXiv 통합 및 PDF 처리ArXiv API를 활용한 논문 검색지능형 PDF 텍스트 추출고급 텍스트 청크 분할임베딩을 활용한 저장 파이프라인다단계 의미 검색초록 수준 검색섹션 단위 검색RAG 파이프라인: 심층 분석Ollama를 통한 로컬 LLM 통합상태 점검 및 모델 탐색지능형 문맥 검색과학적 prompt 엔지니어링완전한 RAG 실행 파이프라인데모 및 대화형 인터페이스주요 데모 흐름검색 데모RAG 데모대화형 검색 인터페이스모드 선택이 가능한 진입점HNSW 기술 노트결과 평가 방법다음 단계: 과학 RAG 시스템 확장결론
8. 완전한 대화형 검색 및 RAG 시스템 구축
시스템 목표 및 기능시스템 아키텍처 개요함께 구축할 내용대화 저장을 위한 데이터베이스 기반대화 스키마 설계최적의 성능을 위한 3개 테이블 아키텍처고성능 벡터 인덱싱대화 가져오기 및 데이터 처리 파이프라인오류 처리를 포함한 견고한 JSON 가져오기원자적 트랜잭션 처리타임스탬프 처리 및 데이터 유효성 검사오류 복구 및 로깅효율적인 임베딩 생성 및 배치 처리모델 관리를 위한 싱글톤 패턴증분 처리 전략최적의 성능을 위한 배치 처리충돌 처리를 포함한 데이터베이스 삽입대화 이해 기능을 활용한 문맥 검색의미적 유사도 검색풍부한 컨텍스트를 위한 다중 테이블 조인결과 서식 지정 및 구조대화 컨텍스트 검색컨텍스트 윈도우 계산대화 이력을 위한 RAG 통합구조화된 컨텍스트 관리Ollama를 통한 로컬 LLM 통합상태 모니터링 및 모델 탐색컨텍스트 검색 및 조립대화형 prompt 엔지니어링성능 모니터링을 포함한 완전한 RAG 파이프라인FastAPI를 활용한 완벽한 웹 APIFastAPI 애플리케이션 구조검증 기능이 포함된 모델 요청검색 엔드포인트 구현RAG 질문-응답 엔드포인트시스템 통계 및 모니터링서버 시작 및 구성데모 및 샘플 데이터실제적인 샘플 데이터 생성다중 주제 샘플 커버리지샘플 데이터 처리 파이프라인종합 시스템 시연단계별 기능 시연조건부 실행을 포함한 RAG 시연프로덕션 가져오기 기능애플리케이션 진입점결론: 완벽한 개인 지식 시스템
9. 벡터 쿼리 언어
핵심 개념데이터 모델기본 구문 구조벡터 연산유사도 검색하이브리드 검색범위 검색일괄 작업벡터 함수 및 집계벡터 함수벡터 합성

목차
저자 소개

Content preview from 벡터 데이터베이스 (Korean Edition)

제6장. SQLite VSS와 Ollama를 활용한 검색 강화 생성(RAG) 시스템구축

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

이전 장들에서는 벡터 검색의 개별 구성 요소, 즉 임베딩 생성 및 유사도 쿼리 수행에 중점을 두었습니다. 이제 이러한 구성 요소들을 결합하여 실제 작동하는 검색 강화 생성(RAG) 시스템을 구축할 차례입니다.

분산 클라우드 클러스터에 의존하는 생산 규모의 웹 애플리케이션과 달리, 여기서의 목표는 단일 데스크톱에서 실행되는 고성능의 비공개, 완전한 로컬 RAG 시스템을 구축하는 것입니다. 검색 엔진으로는 SQLite VSS를, 로컬 LLM “두뇌”로는 Ollama를 사용할 것입니다.

RAG 시스템은 LLMs의 근본적인 한계, 즉 훈련 시점에 지식이 고정되어 사적인 정보나 최신 정보에 접근할 수 없다는 문제를 해결합니다. LLM에 검색 메커니즘을 결합함으로써, 최신 도메인별 지식을 활용해 질문에 답변하는 시스템을 구축할 수 있습니다.

우리의 목표는 Reddit 콘텐츠에 대한 질의에 지능적으로 응답하는 질의응답 시스템을 구축하는 것입니다. 사용자가 질문을 하면 시스템은 (1) 저장된 Reddit 게시물을 검색하여 가장 관련성 높은 정보를 찾고, (2) 가장 잘 일치하는 콘텐츠 조각을 추출하며, (3) 이 맥락을 LLM에 제공하고, (4) 추출된 정보만을 기반으로 자연어 답변을 생성합니다.

이러한 접근 방식은 LLM의 응답을 실제 데이터에 기반하게 함으로써 사실적 정확성을 보장하며, 환각 현상을 크게 줄이고(완전히 제거하진 못하더라도) LLM의 훈련 데이터에 포함되지 않은 비공개 또는 전문적인 콘텐츠도 처리할 수 있게 합니다.

시스템 아키텍처 개요

당사의 RAG 시스템은 서로 연동하여 작동하는 다섯 가지 주요 구성 요소로 이루어져 있습니다:

벡터 데이터베이스 레이어 (SQLite VSS): 콘텐츠 청크와 해당 임베딩을 함께 저장하여 빠른 유사도 검색을 가능하게 함
임베딩 엔진 (SentenceTransformers): 텍스트를 의미적 의미를 포착하는 고밀도 벡터 표현으로 변환
하이브리드 검색 시스템: 최적의 검색 결과를 위해 의미론적 벡터 검색과 기존 키워드 검색을 결합
LLM 통합 (Ollama): 자연어 응답 생성을 위한 로컬 LLM 추론 제공
RAG 파이프라인 오케스트레이터: 검색 및 생성 프로세스를 조정합니다

데이터 흐름은 다음과 같은 경로를 따릅니다: 콘텐츠 수집 → 텍스트 청크화 → 임베딩 생성 → 벡터 저장 → 쿼리 처리 → 하이브리드 검색 → 컨텍스트 검색 → prompt 구성 → LLM 생성. 그림 6-1을 참조하십시오.

Diagram showing the system architecture with components for content ingestion, embedding, storage, search, and LLM integration, illustrating the data flow through ingestion and query processes.

각 구성 요소를 단계별로 구축해 보겠습니다.

벡터 지원이 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

데이터 집약적인 애플리케이션 설계 (Korean Edition), 2nd Edition

Publisher Resources

ISBN: 0642572369835

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business