
47
CHAPTER 2
베이즈 정리
표준화되지 않은 사후확률을 더한 값으로 각 사후확률 값을 나눠서 구한 사후확률을 더하면
1
이 되는 것을 알 수 있다. 이 과정을 ‘표준화
normalization
’라고 하고, 이 때 데이터의 총 확률을 ‘표
준화 상수
normalizing
constant
’라고 한다.
2.4
주사위 문제
베이즈 테이블은 두 개 이상의 가설을 가진 문제를 해결하는 데도 도움이 된다. 다음의 예를
보자.
육면체, 팔면체, 십이면체 주사위가 든 상자가 있다고 가정하자. 이 중 주사위 하나를 임의로 집어
서 굴렸더니
1
이 나왔다. 이 경우 육면체 주사위를 골랐을 확률은 얼마일까?
이 예제에는 동일한 사전확률을 가지는 세 가지 가설이 있다. 데이터는 주사위를 굴린 결과가
1
이 나왔다는 것뿐이다.
만약 육면체 주사위를 골랐다면, 최종 값의 확률은
1
/
6
이다. 팔면체 주사위를 고른 경우라면
확률은
1
/
8
이고, 십이면체 주사위를 골랐다면 확률은
1
/
12
이다.
다음은 자연수를 사용해서 이 가설을 나타내는 베이즈 테이블이다.
table2 = pd.DataFrame(index=[6, 8, 12])
다음에서는 사전확률과 가능도를 분수로 나타낸다. 이렇게 하면 소숫점 이하 숫자를 반올림할
필요가 없다.
from fractions import Fraction