
50
1
부
머신러닝
1인당 GDP
삶의 만족도
그림
1-18
가능한 몇 개의 선형 모델
모델을 사용하기 전에
θ
0
과
θ
1
을 정의해야 합니다. 모델이 최상의 성능을 내도록 하는 값을 어
떻게 알 수 있을까요? 이 질문에 대답하려면 측정 지표를 정해야 합니다. 모델이 얼마나
좋은지
측정하는
효용 함수
utility
function
(또는
적합도 함수
fitness
function
)를 정의하거나 얼마나
나쁜지
측정하
는
비용 함수
cost
function
를 정의할 수 있습니다. 선형 회귀에서는 보통 선형 모델의 예측과 훈련 데
이터 사이의 거리를 재는 비용 함수를 사용합니다. 이 거리를 최소화하는 것이 목표입니다.
여기에서 선형 회귀
linear
regression
알고리즘이 등장합니다. 알고리즘에 훈련 데이터를 공급하면
데이터에 가장 잘 맞는 선형 모델의 파라미터를 찾습니다. 이를 모델을
훈련
training
시킨다고 말
합니다. 이 경우에는 알고리즘이 최적의 파라미터로
θ
0
=
4
.
85
와
θ
1
=
4
.
91
10
-
5
을 찾았습니다.
CAUTION_
조금 혼란스러울 수 있지만 ‘모델’이라는 단어는
모델의 종류
(예를 들면 선형 회귀)나
완전히 정
의된 모델 구조
(예를 들면 하나의 입력과 하나의 출력을 가진 선형 회귀)나 예측에 사용하기 위해 준비된
훈
련된 최종 모델
(예를 들면
θ
0
=
4
.