크로스 인코더처럼 바이 인코더도 대조 학습을 활용합니다. 문장 쌍 사이의 유사도(비유사도)
를 최적화하여 결국 모델이 문장을 특정하게 만드는 요소를 학습합니다.
대조 학습을 수행하려면 두 가지가 필요합니다. 첫째, 비슷한 쌍과 비슷하지 않은 쌍으로 구성
된 데이터입니다. 둘째, 모델이 유사도를 정의하고 최적화하는 방법입니다.
10.4
임베딩 모델 만들기
임베딩 모델을 만드는 방법은 많지만 일반적으로 대조 학습을 사용합니다. 대조 학습을 통해
효과적으로 의미론적 표현을 학습할 수 있기 때문에 많은 임베딩 모델에서 중요한 요소입니다.
하지만 이 방법은 공짜가 아닙니다. 대조 샘플을 만드는 방법과 모델을 훈련하는 방법, 모델을
올바르게 평가하는 방법을 이해해야 합니다.
10.4.1
대조 샘플 생성하기
임베딩 모델을 사전 훈련할 때 자연어 추론
natural
language
inference
(
NLI
) 데이터셋을 사용하는 경우
를 자주 볼 수 있습니다. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.