232
2
부
LLM 활용하기
이 장에서는 앞서 설명한 다양한 이유로
LLM
을 업데이트할 때 사용할 수 있는 기술들을 살펴
봅니다. 이 장은 다음 세 가지 주제로 구성됩니다.
지속적 사전 훈련
주로 도메인 적응이나 모델의 지식을 최신 상태로 유지하는 데 사용하는 방법입니다. 후자는 평생 학습
lifelong
learning
이라고도 합니다.
파라미터 효율적 파인 튜닝(
PEFT
)
전체 파라미터 중 일부만을 업데이트함으로써, 메모리와 계산 자원을 적게 사용하면서도 효율적으로 모델을
훈련하는 기법들의 집합입니다.
모델 병합 및 융합
둘 이상의 모델 파라미터를 결합하는 방식으로, 아직 원리에 대한 이해는 부족하지만 적절히 활용하면 놀라
운 효과를 보입니다. 필자는 이 분야를 자연어 처리의 흑마법
dark
art
이라 부르곤 합니다.
그럼 필자가 가장 선호하는 기법인 지속적 사전 훈련부터 시작해 보겠습니다.
7.1
지속적 사전 훈련
지속적 사전 훈련의 기본 개념은 간단합니다. 사전 훈련이 완료된 모델 체크포인트를 기반으로
자신의 데이터로 훈련을 계속 이어가는 것입니다. 그런데 왜 이런 방식을 사용할까요? 다음과
같은 상황에서 특히 유용합니다.
●
법률, 금융, 생의학 등과 같은 특수 분야에서는 해당 도메인의 텍스트가 일반 영어와 언어적·구조적으로 상당
히 다릅니다. 예를 들어 법률 문서는 긴 문장과 형식적인 문체, 법률 전문 용어로 특징지어지며, 금융 문서는 숫
자 정보가 빈번하게 등장하고, 법률과 금융 문서 모두 반복되는 고정 문구가 자주 포함됩니다. 생의학 ...