연구 결과, 모델이 특정 작업이나 입력에 대해 보이는 성능은 사전 훈련 데이터셋에서 해당 작
업이나 입력과 관련된 단어들의 등장 빈도와 밀접한 상관관계가 있다는 사실이 밝혀졌습니다.
이 현상은 처음에는 라제기
Razeghi
연구진
85
이 관찰했으며, 이후 맥코이
McCoy
연구진의 논문
86
에
서 심층적으로 분석되었습니다.
맥코이 연구진은 언어 모델이 훈련 데이터셋에서 더 자주 등장한 작업에서 상대적으로 높은 성
능을 보인다는 사실을 보여주었습니다. 예를 들어 모델은
10
진수 덧셈에는 능숙하지만
9
진수
덧셈에는 상대적으로 취약하며, 알파벳순 정렬은 잘 수행하지만 알파벳 역순 정렬은 상대적으
로 어렵게 처리합니다.
또한 유사한 작업에서도 출력 결과가 사전 훈련 데이터셋에서 높은 빈도로 등장할 때 모델의
성능이 더 높아진다는 사실도 확인되었습니다. 입력 데이터에서도 마찬가지로, 훈련 데이터셋
에서 더 자주 등장한 입력일수록 모델이 더 잘 대응하는 경향을 보였습니다.
예를 들어
LLM
에 ‘
record
a
be
that
miles
,
yes
,
hour
,
per
fifty
clocked
he
.’라는 문장의 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.