을 출시했다면 어떨까요? 핵심 기능이 언어 생성이 아니지만 텍스트 표현을 다루는 모델이 대
규모 언어 모델이 아닐까요?
이런 식의 정의는 유능한 모델을 제외한다는 점에서 문제가 됩니다. 모델에 어떤 이름을 붙이
든 모델의 동작이 바뀌지는 않습니다.
‘대규모 언어 모델’이란 용어의 정의는 새로운 모델이 출시됨에 따라 진화합니다. 따라서 이 책
에서 언급하는 대규모 언어 모델이 어떤 의미인지 정확히 밝히겠습니다. ‘대규모’라는 용어의
정의는 임의적이므로 오늘날 대규모 모델이라고 간주되는 것이 미래에 소규모로 생각될 수 있
습니다. 동일한 것을 가리키는 이름이 많이 있습니다. 우리에게는 텍스트를 생성하지 않고 사
용자의 하드웨어에서 실행할 수 있는 모델도 ‘대규모 언어 모델’에 속합니다.
따라서 이 책은 생성 모델 외에
10
억 개 이하의 파라미터를 가지고 텍스트를 생성하지 않는 모
델도 다룹니다. 임베딩 모델, 표현 모델,
BoW
같은 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.