
149
3
장
LLM 기반 애플리케이션 개발
3.4.5
프로젝트
5
: 문서 정리
이 프로젝트는
GPT
-
4o
의 자연어 처리 기능을 사용해 문서를 정리합니다. 명확하지 않은 구
조로 구성된 방대한 문서를 접한 적이 있을 겁니다. 문서에 새로운 내용이 추가되면 그 구조마
저 흐트러지는 경우도 있습니다.
이 프로젝트는
GPT
모델을 사용해 문서 분류 솔루션에 필요한 정보를 제공합니다. 문서는 날
짜, 작성자, 제목 등의 메타데이터를 포함할 수 있으며, 이를
GPT
-
4o
의 분석 결과와 결합할
수 있습니다. 다음과 같은 간단한 프롬프트를 작성하겠습니다.
예시
3-25
문서 정리 프롬프트
prompt = '''당신은 문서 정리원입니다.
문서를 분석하고, 주요 주제를 추출하고, 간단히 줄인 내용을 생성합니다.
정보는 JSON 형식을 사용해 제공하며, 다음 구조를 사용합니다.{
"topics": ["주요 주제 1", "주요 주제 2", "주요 주제 3"],
"summary": "문서의 요약"
}
'''
다른 도구에서 쉽게 파싱할 수 있는
JSON
형식으로 결과를 출력하는 걸 권장합니다. 이 예시
에서는 모든 문서가 모델의 최대 토큰 한도를 초과하지 않는다고 가정하고 내용을 바로 프롬프
트에 전달합니다.
예시
3-26
프롬프트에 문서 전달
response = client.chat.completions.create( ...