사전 훈련된 표현 모델을 분류 작업에서 미세 튜닝하는 여러 방법을 살펴보았습니다. 사전 훈
련된
BERT
모델을 미세 튜닝하는 방법과 이 예제를 확장하여 모델의 특정 층을 동결하는 방법
도 알아보았습니다.
퓨샷 분류 기법인
SetFit
을 실험해 보았습니다. 레이블이 있는 적은 양의 데이터를 사용해 사전
훈련된 임베딩 모델과 분류 헤드를 미세 튜닝했습니다. 적은 수의 데이터 포인트만 사용해서
이 장의 초반에 살펴본 모델과 비슷한 성능을 냈습니다.
그다음 추가적인 사전 훈련 개념을 다루었습니다. 사전 훈련된
BERT
모델을 시작점으로 사용
해 다른 데이터에서 훈련을 계속합니다. 마스크드 언어 모델링을 사용해 표현 모델을 만들 뿐
만 아니라 사전 훈련된 모델을 계속 훈련할 수 있습니다.
마지막으로 비정형 텍스트에서 사람이나 장소 같은 특정 개체를 식별하는 작업인 개체명 인식
을 살펴보았습니다. 이전 예제와 비교하면 이 분류 작업은 문서 수준이 아니라 단어 수준에서
수행됩니다.
다음 장에서 생성 언어 모델의 미세 튜닝에 대해 계속 알아보겠습니다. 지시를 잘 따르게 하여
사람의 선호도에 맞추도록 세 단계에 걸쳐 생성 모델을 미세 튜닝하는 방법을 배우겠습니다.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.