
238
2
부
LLM 활용하기
요약하자면, 지속적 사전 훈련은 도메인 특화 텍스트가 충분히 많고 해당 도메인이 고유한 언
어 구조나 어휘를 갖는 경우에 특히 효과적입니다. 또한 지속적 사전 훈련은
LLM
을 새로운 언
어에 적응시키는 데도 활용할 수 있습니다.
TIP
도메인 특화 텍스트에는 해당 분야에서만 사용하는 전문 용어
jargon
가 포함될 때가 많습니다. 필자가 효과를 본
전략 중 하나는 해당 전문 용어들을 별도의 토큰으로 추가해 모델에 반영하는 것입니다.
지속적 사전 훈련에는 상당한 연산 자원이 필요하지만, 소규모 데이터셋에 대한 파인 튜닝은
훨씬 적은 자원으로 수행할 수 있습니다. 오늘날처럼 거대 언어 모델이 보편화된 시대에는 연
산과 메모리 자원 소모를 줄이는 다양한 방법을 모색하는 것이 중요합니다.
다음으로는 제한된 자원 환경에서도 파인 튜닝을 가능하게 하는 파라미터 효율적 파인 튜닝
(
PEFT
) 기법들을 살펴보겠습니다.
7.2
파라미터 효율적 파인 튜닝(
PEFT
)
PEFT
의 핵심은 전체 모델 파라미터를 모두 업데이트하는 대신, 일부만 선택적으로 업데이트
함으로써 연산과 저장 비용을 크게 줄이는 데 있습니다.
현재 널리 사용되는
PEFT
기법들은 크게 다음 세 가지로 나눌 수 있습니다.
●
새로운 파라미터 추가: 기존 모델에 추가 파라미터를 삽입하고, 지속적 ...