book

벡터 데이터베이스 (Korean Edition)

Name: 벡터 데이터베이스 (Korean Edition)
Author: Nitin Borwankar
ISBN: 0642572369835

by Nitin Borwankar

April 2026

Intermediate

292 pages

4h 39m

Korean

O'Reilly Media, Inc.

Read now

Unlock full access

서문
이 책의 내용이 책의 대상 독자이 책의 활용 방법소프트웨어, 환경 및 리소스 요구 사항이 책에서 사용하는 표기법코드 예제 활용O’Reilly 온라인 학습문의 방법감사의 말
1. 벡터 데이터베이스 소개
벡터 데이터베이스가 필요한 이유는 무엇인가?새로운 데이터 유형: 벡터유사도 검색벡터 데이터 유형의 특징은 무엇인가?벡터 데이터베이스는 어디에 사용하나요?SQL 대 벡터 데이터베이스비즈니스 수학의 기초: 회계 산술관계형 데이터베이스 관리 시스템에서의 벡터 표현벡터 전용 기능의 필요성NoSQL 대 벡터 데이터베이스NoSQL 데이터베이스와 벡터 저장NoSQL 데이터베이스에서 벡터 확장 기능의 한계벡터 확장이 적용된 NoSQL을 선택해야 할 때하이브리드 접근법: 구조화된 데이터와 벡터 데이터의 결합벡터 데이터와 메타데이터 모두의 필요성순수 벡터 스토리지의 한계하이브리드 데이터베이스 아키텍처하이브리드 쿼리의 예하이브리드 접근 방식의 장점결론
2. 임베딩
벡터 임베딩 이해: 왜 필요한가Word2Vec: 모든 것을 바꾼 획기적인 발전Doc2Vec: 단어에서 문서로임베딩에서 최신 언어 모델까지: 트랜스포머의 연결인코더 전용 트랜스포머(BERT 및 그 변형 모델)디코더 전용 트랜스포머 (GPT 계열)인코더-디코더 트랜스포머 (T5, BART)임베딩 모델: 특화된 벡터 생성기기존 모델과의 차이점현대 LLM 애플리케이션에서의 역할실용적 응용 및 사용 사례간단한 RAG 파이프라인SentenceTransformers 라이브러리: 텍스트 임베딩의 만능 도구SentenceTransformers 사용을 위한 모범 사례: 상세 가이드임베딩 레이어: 제로샷 학습으로 가는 관문트랜스포머 임베딩의 구조제로샷 학습과의 연관성제로샷 학습을 가능하게 하는 주요 특징한계 및 고려 사항최신 동향 및 발전Word2Vec을 활용한 벡터 연산: 실습 가이드1단계: 설정 및 설치2단계: 사전 학습된 Word2Vec 모델 불러오기3단계: 벡터 연산 함수 구현4단계: 고전적인 왕-여왕 비유5단계: 더 흥미로운 유추6단계: 대화형 탐색 도구벡터 산술에 대한 마무리결론
3. FAISS를 이용한 유사도 검색
기초벡터 표현거리 측정법선택 휴리스틱FAISS 인덱스플랫 인덱스 (무차별 대입법)IVF 기반 인덱스LSH 기반 인덱스HNSW 기반 인덱스기타 특수 인덱스복합 및 변환 인덱스적합한 지수 선택양자화SQPQANN 문제문제점계산 비용 절감FAISS의 주요 ANN 기법FAISS에서 인덱스 선택코드 예제HNSW 인덱스 이해HNSW란 무엇인가?HNSW의 작동 원리주요 매개변수 설명실전 예제: 유사도 검색 시스템 구축성능 특성모범 사례FAISS 아키텍처 및 구성 요소기초핵심 개념주요 구성 요소일반적인 워크플로예시주요 내용심화 학습결론
4. SQLite3를 이용한 시맨틱 검색
SQLite 벡터 유사도 검색 확장 기능 이해핵심 기능아키텍처 개요제한 사항개발 환경 설정종속성 설치설치 확인운영 관련 지침데이터베이스 스키마 설계스키마 요구 사항테이블 정의스키마 설계 결정 사항Python Reddit API 래퍼를 사용하여 Reddit에 연결하기Reddit API 자격 증명 생성PRAW 클라이언트 구현사용 예시콘텐츠 추출 및 전처리텍스트 정리 파이프라인품질 필터링임베딩 생성 및 저장임베딩 생성기데이터베이스 저장배치 처리 파이프라인벡터 인덱스 구축VSS 인덱싱 이해인덱스 관리시맨틱 검색 구현검색 결과 컨테이너검색 엔진모든 요소 통합워크플로 예시출력 예시확장: 증분 인덱싱결론
5. PostgreSQL pgvector를 활용한 ArXiv 논문 검색 시스템 구축
과학 문헌 검색의 과제ArXiv가 이상적인 데이터 소스인 이유실제 사용 사례기술 스택 선정 근거아키텍처 개요시스템 구성 요소데이터 흐름설계 철학환경 설정 및 종속성PostgreSQL 및 pgvector 설치Python 환경 설정디렉터리 구조 및 구성검증 및 테스트과학 논문을 위한 데이터베이스 설계스키마 설계 원칙핵심 테이블 구조벡터 저장 전략인덱싱 전략ArXiv 통합 및 PDF 관리ArXiv API 클라이언트 구현PDF 다운로드 파이프라인배치 처리 시스템PDF 텍스트 추출 및 처리PDF 추출의 과제지능형 텍스트 청크 분할임베딩 생성 및 저장임베딩 모델 전략배치 처리 파이프라인유사도 검색 구현대화형 애플리케이션 및 UI로컬 배포를 위한 Docker 패키징컨테이너 아키텍처Docker Compose 구성데이터베이스 초기화 스크립트개발 워크플로Cloud 지원 설계기본 성능 튜닝인덱스 구성쿼리 성능리소스 관리다음 단계현재의 제한 사항개선 제안수행 내용시스템 성과습득한 기술 역량실용적인 연구 도구고급 시스템의 기반미래의 잠재력결론
6. SQLite VSS와 Ollama를 활용한 검색 강화 생성(RAG) 시스템 구축
시스템 아키텍처 개요벡터 지원이 포함된 데이터베이스 기반벡터 지원 데이터베이스 구축RAG를 위한 스키마 설계검색 인덱스 생성텍스트 처리 및 임베딩 생성임베딩 모델 관리지능형 텍스트 청크 분할임베딩을 활용한 콘텐츠 저장하이브리드 검색 구현하이브리드 검색 알고리즘시맨틱 검색 구성 요소키워드 검색 컴포넌트점수 통합 및 순위 지정Ollama를 활용한 LLM 통합Ollama API 클라이언트상태 점검 기능RAG 파이프라인컨텍스트 서식 지정질문-답변 파이프라인시연 및 테스트샘플 데이터 로딩주요 데모 기능대화형 Q&A 인터페이스빠른 테스트 유틸리티다음 단계: 시스템 확장Reddit 데이터의 누락된 특징성능 최적화실전 적용 시 고려 사항고급 RAG 패턴결론
7. PostgreSQL 및 pgvector를 활용한 과학적 RAG 시스템 구축
시스템 목표 및 기능아키텍처 개요pgvector를 활용한 데이터베이스 기반데이터베이스 구성 및 설정과학 논문을 위한 스키마 설계고성능 벡터 인덱스임베딩 생성 전략ArXiv 통합 및 PDF 처리ArXiv API를 활용한 논문 검색지능형 PDF 텍스트 추출고급 텍스트 청크 분할임베딩을 활용한 저장 파이프라인다단계 의미 검색초록 수준 검색섹션 단위 검색RAG 파이프라인: 심층 분석Ollama를 통한 로컬 LLM 통합상태 점검 및 모델 탐색지능형 문맥 검색과학적 prompt 엔지니어링완전한 RAG 실행 파이프라인데모 및 대화형 인터페이스주요 데모 흐름검색 데모RAG 데모대화형 검색 인터페이스모드 선택이 가능한 진입점HNSW 기술 노트결과 평가 방법다음 단계: 과학 RAG 시스템 확장결론
8. 완전한 대화형 검색 및 RAG 시스템 구축
시스템 목표 및 기능시스템 아키텍처 개요함께 구축할 내용대화 저장을 위한 데이터베이스 기반대화 스키마 설계최적의 성능을 위한 3개 테이블 아키텍처고성능 벡터 인덱싱대화 가져오기 및 데이터 처리 파이프라인오류 처리를 포함한 견고한 JSON 가져오기원자적 트랜잭션 처리타임스탬프 처리 및 데이터 유효성 검사오류 복구 및 로깅효율적인 임베딩 생성 및 배치 처리모델 관리를 위한 싱글톤 패턴증분 처리 전략최적의 성능을 위한 배치 처리충돌 처리를 포함한 데이터베이스 삽입대화 이해 기능을 활용한 문맥 검색의미적 유사도 검색풍부한 컨텍스트를 위한 다중 테이블 조인결과 서식 지정 및 구조대화 컨텍스트 검색컨텍스트 윈도우 계산대화 이력을 위한 RAG 통합구조화된 컨텍스트 관리Ollama를 통한 로컬 LLM 통합상태 모니터링 및 모델 탐색컨텍스트 검색 및 조립대화형 prompt 엔지니어링성능 모니터링을 포함한 완전한 RAG 파이프라인FastAPI를 활용한 완벽한 웹 APIFastAPI 애플리케이션 구조검증 기능이 포함된 모델 요청검색 엔드포인트 구현RAG 질문-응답 엔드포인트시스템 통계 및 모니터링서버 시작 및 구성데모 및 샘플 데이터실제적인 샘플 데이터 생성다중 주제 샘플 커버리지샘플 데이터 처리 파이프라인종합 시스템 시연단계별 기능 시연조건부 실행을 포함한 RAG 시연프로덕션 가져오기 기능애플리케이션 진입점결론: 완벽한 개인 지식 시스템
9. 벡터 쿼리 언어
핵심 개념데이터 모델기본 구문 구조벡터 연산유사도 검색하이브리드 검색범위 검색일괄 작업벡터 함수 및 집계벡터 함수벡터 합성

목차
저자 소개

Content preview from 벡터 데이터베이스 (Korean Edition)

제7장. PostgreSQL과 pgvector를 활용한 과학용 RAG 시스템구축

이 작품은 AI를 사용하여 번역되었습니다. 여러분의 피드백과 의견을 환영합니다: translation-feedback@oreilly.com

과학 논문의 폭발적인 증가는 연구자들에게 압도적인 과제를 안겨줍니다. 바로 수백만 편의 논문에서 관련 지식을 효율적으로 발견하고, 이해하며, 종합하는 방법입니다. ArXiv만 해도 물리학, 수학, 컴퓨터 과학 및 기타 분야에 걸쳐 매달 15,000편 이상의 논문을 발표합니다. 기존의 키워드 검색 방식은 과학적 담론이 지닌 풍부한 의미적 맥락을 포착하지 못합니다. 과학적 담론에서는 동일한 개념이 서로 다른 분야와 연구 커뮤니티에 걸쳐 무수히 다양한 방식으로 표현될 수 있기 때문입니다 .

이 장에서는 과학 문헌을 위해 특별히 설계된 RAG 시스템을 구축합니다. 범용 RAG 시스템과 달리, 과학용 RAG는 다음과 같은 고유한 과제를 해결해야 합니다:

전문 용어: 논문은 단순한 키워드 이상의 의미적 이해가 필요한, 정밀하고 분야 특유의 언어를 사용합니다.
구조화된 콘텐츠: 과학 논문은 검색 전략 수립에 도움이 될 수 있는 관례(초록, 방법론, 결과, 결론)를 따릅니다.
인용 네트워크: 논문은 추가적인 맥락을 제공하는 인용 네트워크 속에 존재한다.
수학적 표기법: 수식과 방정식은 이 구현 방식으로는 포착되지 않는 의미를 담고 있다. 수학적 표기법을 처리하려면 LaTeX OCR과 같은 전문 도구가 필요하다.
증거의 품질: 모든 출처가 동등한 것은 아닙니다. 동료 평가, 게재지, 인용 횟수가 중요합니다.

시스템 목표 및 기능

당사의 과학 RAG 시스템은 다음을 가능하게 할 것입니다:

의미론적 발견: 단순한 키워드 일치뿐만 아니라 개념적 유사성을 기반으로 논문을 찾습니다.
논문 간 통합: 여러 논문의 정보가 필요한 질문에 답합니다.
문맥 이해: 질문과 관련된 특정 섹션(방법론, 결과)을 검색합니다.
증거 기반 응답: 실제 연구를 바탕으로 한 답변을 생성하며, 출처 논문에 대한 인용을 포함합니다(서식 조정은 후처리가 필요합니다).
기술적 심층 분석: 해당 분야의 전문 지식이 필요한 복잡한 과학적 쿼리를 처리합니다.

아키텍처 개요

시스템 아키텍처는 서로 연결된 6개의 구성 요소로 이루어져 있습니다( 그림 7-1 참조).

Diagram of a system architecture with six interconnected components: data ingestion, vector processing, storage, retrieval, generation, and user interface.

구성 요소를 좀 더 자세히 살펴보겠습니다:

데이터 수집 계층

ArXiv API 통합: 논문 메타데이터 및 PDF 가져오기
PDF 처리: 과학 논문 PDF에서 구조화된 텍스트 추출
섹션 감지: 논문 섹션(서론, 방법, 결과) 식별

벡터 처리 파이프라인

임베딩 생성: SentenceTransformers를 사용하여 텍스트를 밀도 높은 벡터로 변환
계층적 임베딩: 초록과 섹션에 대해 별도의 벡터 생성
차원: 품질과 성능의 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572369835

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business