
128
머신러닝 인터뷰 실무 가이드
자기 지도 학습
Self
-
supervised
learning
19
은 레이블을 사용하지 않고 데이터 세트 자체에 잠재해 있
는 표현을 학습합니다. 예를 들어서, 이미지의 특정 부분이 제거되었을 때, 우리는 그 누락된
부분을 예측하거나 재생성할 수 있을까요? 자기 지도 학습은 이미지, 오디오, 비디오
20
, 텍스
트 등의 누락된 부분을 채우는 데에 일반적으로 사용됩니다.
TIP
인터뷰 중에 레이블 데이터가 없거나 모든 데이터를 레이블링할 필요가 없는 경우에 대한 논의가 나오
면 준지도 학습과 자기 지도 학습을 언급할 수 있습니다.
강화 학습 요약
데이터 세트 또는 레이블 사용 여부로 구분되는 머신러닝의 세 번째 주요 유형은 강화 학습
reinforcement
learning
(
RL
)입니다.
RL
의 기본 형태는 반드시 사전 데이터 세트를 필요로 하지 않지
만, 업계에서는 주로
RL
알고리즘을 실제 배포 전에 오프라인에서 테스트할 수 있도록 기존
데이터 세트나 모델을 보유하는 것을 선호합니다.
RL
은 ‘에이전트’를 사용하는데, 앞서 소개한 머신러닝 ‘모델’과는 다르지만 반복적인 학습을
통해 개선된다는 공통점이 있습니다.
RL
은 시행착오를 통해 학습합니다. 에이전트는 새로운
데이터 포인트에 대해 반응만 하면 되며, 경험을 통해 최적의 다음 ...