
338
1
부
머신러닝
(즉 그림자 부분의 면적 ). 하지만
θ
를 모른 채 대신 샘플
x
=
2
.
5
(왼쪽 위 그래프에 있는 수직
선) 하나를 관측했다면 어떻게 할 수 있을까요? 이 경우 오른쪽 위 그래프에 나타난 가능도 함
수
ℒ
(
θ
|
x
=
2
.
5
)
=
f
(
x
=
2
.
5
;
θ
)를 얻습니다.
최대
최대
모델 가능도 함수
그림
9-20
모델의 파라미터 함수(왼쪽 위)와 여기에서 유도된 함수:
PDF
(왼쪽 아래), 가능도 함수(오른쪽 위),
로그 가능도 함수(오른쪽 아래)
간단히 말해
PDF
는
x
의 함수입니다 (
θ
고정 ). 반면 가능도 함수는
θ
의 함수입니다 (
x
고정 ).
가능도 함수가 확률 분포가 아니라는 것을 이해하는 것이 중요합니다. 가능한 모든
x
에 대해서
확률 분포를 적분하면 항상
1
이 됩니다. 하지만 가능한 모든
θ
에 대해서 가능도 함수를 적분하
면 어떤 양숫값도 될 수 있습니다.
데이터셋
X
가 주어졌을 때 일반적으로 모델 파라미터에 대해 가장 그럴듯한 값을 예측합니다.
이를 위해
X
에 대한 가능도 함수를 최대화하는 값을 찾아야 합니다. 이 예에서 샘플
x
=
2
.
5
하
나를 관측했다면
θ
의
최대
가능도
추정
maximum
likelihood
estimate
(
MLE
)은
=
1
.
5
입니다.
θ
에 대한
사전 확률 분포
g
가 존재한다면
ℒ
(
θ
|
x
)
를 최대화하는 것보다 ...