
214
2
부
LLM 활용하기
모델 보정 기법 중 하나는 레이블 스무딩입니다. 일반적인 분류 모델 훈련에서는
0
이나
1
과 같
은 하드 타겟 레이블
hard
target
label
을 사용합니다. 이때 교차 엔트로피 손실 함수는 모델의 출력값
인 로짓이
0
이나
1
에 가깝도록 유도하므로 모델이 지나치게 확신하는 상태로 이어지기 쉽습니
다. 레이블 스무딩은 여기에 정규화 항을 적용해 하드 타겟 레이블을 완화된 값으로 바꾸는 방
식입니다.
특히 노이즈가 포함된 데이터셋(즉, 잘못된 레이블이 일부 섞인 데이터셋 )에 유용합니다. 정
규화는 모델이 부정확한 예시에서 과도하게 학습하는 것을 방지해 줍니다.
정치 공약 감지기 모델에서는 일부 예시가 주관적이거나 해석의 여지가 있을 수 있으므로 레이
블 스무딩을 사용하는 것이 바람직합니다.
노이즈 임베딩
파인 튜닝에 사용되는 데이터셋은 보통
5
만 개 이하의 적은 수의 예제로 구성됩니다. 이때 모
델이 데이터셋의 문체적 특성(예: 포맷, 표현 방식, 텍스트 길이 )에 과적합되지 않기를 원합니
다. 이를 해결하는 한 가지 방법은 입력 임베딩에 노이즈를 추가하는 것입니다.
자인
Jain
연구진
17
은 노이즈 임베딩을 추가하면 모델이 파인 튜닝 데이터셋의 표현 방식과 포맷
에 과적합되는 경향이 줄어든다는 점을 관찰했습니다. 노이즈 임베딩의 흥미로운 ...