
116
머신러닝 인터뷰 실무 가이드
워’라고 말해주며, 여러분이 물건에 가까워질수록 ‘더워’라고 하고 멀어질수록 ‘추워’라고 말
합니다. 이 게임에서는 물건이 있는 위치에 도달할 때까지 ‘더워지는’ 방향으로 이동해야 합
니다.
4
장에서는 잔차와 매우 유사한 개념인 평균 제곱 오차(
MSE
), 평균 제곱근 오차 (
RMSE
) 등
과 같은 오차 용어를 통해 모델을 평가하는 방법에 대해 설명할 것입니다. 이들 사이의 주요
차이점은 잔차가 과거 관측 데이터와 모델 추정치 사이의 차이인 반면, 오차는 모델 추정치
와 모델이 미처 본 적 없는 실제 데이터 사이의 차이입니다. 즉, 오차는 모델 성능을 평가하
기 위해 이전에 보지 못한 데이터에 모델을 적용한 후의 차이를 말합니다.
학습/테스트 세트 분할 정의
요약하자면, 이전 절의 단순 선형 회귀 예시와 같은 지도 학습
5
머신러닝을 사용할 때, 여러
분은 일반적으로 데이터 세트를 하나 준비해서 머신러닝 알고리즘이 작동 원리를 모델로 학
습하도록 할 것입니다. 그런 다음 이 모델을 사용하여 사과가 얼마에 팔릴지를 예측하는 예
처럼 종속변수의 값을 계산하게 될 겁니다. 다른 말로 하면, 여러분은 미래의 데이터 포인트
가 아닌 과거의 데이터 포인트의 데이터 세트를 가지고 있다는 것입니다. 머신러닝 모델이
학습될 때는 현재 가지고 있는 데이터에 ...