Skip to Content
핸즈온 LLM
book

핸즈온 LLM

by 제이 알아마르, 마르턴 흐루턴도르스트, 박해선
June 2025
Beginner to intermediate
460 pages
11h 46m
Korean
Hanbit Media, Inc.
Content preview from 핸즈온 LLM
408
3부 언어 모델 훈련 및 미세 튜닝
'
My
name
is
Maarten
'
이란 문장에서 단어
'
Maarten
'
의 부분토큰이 사람으로 올바르게 분
류되었습니다!
11.5
요약
사전 훈련된 표현 모델을 분류 작업에서 미세 튜닝하는 여러 방법을 살펴보았습니다. 사전 훈
련된
BERT
모델을 미세 튜닝하는 방법과 이 예제를 확장하여 모델의 특정 층을 동결하는 방법
도 알아보았습니다.
퓨샷 분류 기법인
SetFit
을 실험해 보았습니다. 레이블이 있는 적은 양의 데이터를 사용해 사전
훈련된 임베딩 모델과 분류 헤드를 미세 튜닝했습니다. 적은 수의 데이터 포인트만 사용해서
이 장의 초반에 살펴본 모델과 비슷한 성능을 냈습니다.
그다음 추가적인 사전 훈련 개념을 다루었습니다. 사전 훈련된
BERT
모델을 시작점으로 사용
해 다른 데이터에서 훈련을 계속합니다. 마스크드 언어 모델링을 사용해 표현 모델을 만들 뿐
만 아니라 사전 훈련된 모델을 계속 훈련할 수 있습니다.
마지막으로 비정형 텍스트에서 사람이나 장소 같은 특정 개체를 식별하는 작업인 개체명 인식
을 살펴보았습니다. 이전 예제와 비교하면 이 분류 작업은 문서 수준이 아니라 단어 수준에서
수행됩니다.
다음 장에서 생성 언어 모델의 미세 튜닝에 대해 계속 알아보겠습니다. 지시를 잘 따르게 하여
사람의 선호도에 맞추도록 세 단계에 걸쳐 생성 모델을 미세 튜닝하는 방법을 배우겠습니다.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

LLMOps

LLMOps

Abi Aryan
딥러닝의 정석(2판)

딥러닝의 정석(2판)

니틴 부두마, 니킬 부두마, 조 파파
FastAPI

FastAPI

Bill Lubanovic

Publisher Resources

ISBN: 9791169213516