Skip to Content
핸즈온 LLM
book

핸즈온 LLM

by 제이 알아마르, 마르턴 흐루턴도르스트, 박해선
June 2025
Beginner to intermediate
460 pages
11h 46m
Korean
Hanbit Media, Inc.
Content preview from 핸즈온 LLM
342
3부 언어 모델 훈련 및 미세 튜닝
들어진 임베딩을 소프트맥스 분류기를 통해 최적화합니다.
5
이 구조를 바이 인코더 또는
SBERT
sentence
-
BERT
라고 부릅니다. 바이 인코더는 매우 빠르고 정확
한 문장 표현을 만들지만 일반적으로 크로스 인코더보다 성능이 떨어집니다(하지만 크로스 인
코더는 임베딩을 생성하지 않습니다 ).
크로스 인코더처럼 바이 인코더도 대조 학습을 활용합니다. 문장 쌍 사이의 유사도(비유사도)
를 최적화하여 결국 모델이 문장을 특정하게 만드는 요소를 학습합니다.
대조 학습을 수행하려면 두 가지가 필요합니다. 첫째, 비슷한 쌍과 비슷하지 않은 쌍으로 구성
된 데이터입니다. 둘째, 모델이 유사도를 정의하고 최적화하는 방법입니다.
10.4
임베딩 모델 만들기
임베딩 모델을 만드는 방법은 많지만 일반적으로 대조 학습을 사용합니다. 대조 학습을 통해
효과적으로 의미론적 표현을 학습할 수 있기 때문에 많은 임베딩 모델에서 중요한 요소입니다.
하지만 이 방법은 공짜가 아닙니다. 대조 샘플을 만드는 방법과 모델을 훈련하는 방법, 모델을
올바르게 평가하는 방법을 이해해야 합니다.
10.4.1
대조 샘플 생성하기
임베딩 모델을 사전 훈련할 때 자연어 추론
natural
language
inference
(
NLI
) 데이터셋을 사용하는 경우
를 자주 볼 수 있습니다. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

LLMOps

LLMOps

Abi Aryan
딥러닝의 정석(2판)

딥러닝의 정석(2판)

니틴 부두마, 니킬 부두마, 조 파파
FastAPI

FastAPI

Bill Lubanovic

Publisher Resources

ISBN: 9791169213516