
276
2
부
LLM 활용하기
8.8.3
추론을 위한 파인 튜닝
모델에서 더 나은 추론 능력을 유도하는 한 가지 방법은 추론 데이터셋으로 파인 튜닝하는 것
입니다. 전형적인 추론 데이터셋이 어떤 모습인지 살펴보기 위해 스컹크웍스
AI
SkunkworksAI
가 공
개한
reasoning
-
0
.
01
데이터셋
24
을 확인해 보겠습니다.
입력: 주사위를 세 번 굴릴 때, 합이 11이 될 확률은 얼마인가요?
추론: [{“step”: 1, “thought”: “문제 이해하기: 주사위를 세 번 굴릴 때 합이 11이 될
확률을 찾아야 합니다.”},
{“step”: 2, “thought”: “전체 가능한 결과 계산하기: 주사위에는 6개의 면이 있으므
로, 각 굴림에 6가지 가능성이 있습니다. 세 번 굴릴 때 전체 가능한 결과는 6^3 = 216
입니다.”},
{“step”: 3, “thought”: “유리한 결과 식별하기: 합이 11이 되는 모든 굴림 조합을 나
열합니다. 그런 조합은 18개가 있습니다.”},
{“step”: 4, “thought”: “확률 계산하기: 유리한 결과의 수를 전체 가능한 결과의 수로
나눕니다: 18 / 216 = 1/12.”},
{“step”: 5, “thought”: “결론: 주사위를 세 번 굴릴 때 합이 11이 될 확률은 1/12입니
다.”}]
출력: 1/12
이 데이터셋은 ...