
114
러닝 랭체인
03
CHAPTER
RAG
2
단계: 데이터 기반 대화
2
장에서는 데이터를 처리하고 임베딩을 생성해 벡터 저장소에 저장하는 방법을 배웠다. 이
번 장에서는 사용자의 질의를 바탕으로 가장 연관성 높은 임베딩과 청크를 효율적으로 검색
하는 방법을 설명한다. 이를 통해 관련 문서를 컨텍스트로 활용한 프롬프트를 구성해
LLM
의
최종 출력 정확도를 향상시킬 수 있다.
사용자 질의를 임베딩하고 데이터 소스에서 유사 문서를 검색한 후, 이를 프롬프트에 컨텍스
트로 활용하는 과정을
검색 증강 생성
retrieval
-
augmented
generation
(
RAG
)이라 부른다.
RAG
는 채팅
LLM
애플리케이션 구축에 필수적인 구성 요소로 정확하고 효율적이며 최신 정보를 제공한
다. 이번 장에서는 기초부터 심화까지 단계별로 안내해, 벡터 저장소와 데이터베이스 등 다
양한 데이터 소스 및 구조화와 비구조화 데이터를 활용한 효과적인
RAG
시스템 구축 방법을
다룬다. 먼저
RAG
의 개념을 정립하고 그 장점을 살펴보자.
3.1
RAG
시작하기
RAG
는 외부 자료에서 얻은 컨텍스트를 제공해
LLM
의 생성 정확도를 높이는 기법이다. 해
당 용어는 메타
Meta
AI
연구진의 논문에서 처음 제시됐으며,
RAG
기법을 적용해 훈련한 모델