다. 대조 학습은 벡터 공간에서 비슷한 문서가 가까이 놓이고 비슷하지 않은 문서는 멀리 떨어
지도록 임베딩 모델을 훈련하는 것이 목적입니다.
2
장에서 본
word2vec
방법과 매우 비슷하
기 때문에 익숙하게 들릴 수 있습니다. [그림
10
-
2
]와 [그림
10
-
3
]에서 이미 이 개념을 선보였
습니다.
대조 학습의 기본 아이디어에 따르면 문서 간의 유사성/비유사성을 학습하고 모델링하는 가장
좋은 방법은 비슷한 샘플 쌍과 비슷하지 않은 샘플 쌍을 모델에게 제공하는 것입니다. 문서의
의미를 정확하게 포착하기 위해 문서를 다르거나 비슷하게 만드는 요소를 모델이 학습하도록
여타 문서와 대조할 필요가 있습니다. 이런 대조 과정은 매우 강력하며 문서가 쓰인 맥락과 관
련이 있습니다. [그림
10
-
4
]에 이 과정을 고수준으로 나타냈습니다.
임베딩 모델
입력
문서
A
문서
B
출력
비슷함/비슷하지 않음
그림
10-4
대조 학습의 목적은 문서가 비슷한지 다른지를 임베딩 모델에게 가르치는 것입니다. 이를 위해 어느 정도 유
사하거나 유사하지 않은 문서 집합을 모델에게 제공합니다.
또 대조 학습은 설명의 본질을 생각하는 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.
O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.