
68
개발자를 위한 필수 수학
이는 중요하게 고려해야 할 질문이며 데이터가 전체 스토리의 일부만 이야기하는 원인이기도
합니다. 커피를 마시는지 여부를 ‘예/아니요’로 간단히 표시한 환자 목록을 받는다면 특정한 임
곗값을 정의해야 합니다. 또는 ‘지난
3
년 동안 커피를 마신 횟수’와 같이 조금 더 가중치가 부여
된 지표가 필요합니다. 예제에서는 ‘커피를 마시는 사람’의 자격을 정의하지 않고 간단하게 설
명했지만, 실제 현장에서는 항상 데이터에서 실마리를 찾는 것이 좋다는 점에 유의하세요. 이
에 대해서는
3
장에서 자세히 설명하겠습니다.
베이즈 정리 이면에 있는 직관을 더 깊이 탐구하고 싶다면 부록
A
.
4
절을 참조하세요. 지금은
조건부 확률을 뒤집는 데 도움이 된다는 것만 알면 됩니다. 조건부 확률이 결합 및 합 연산과
어떻게 상호 작용하는지에 대해서는 이어지는 절에서 살펴보겠습니다.
TIP
나이브 베이즈
베이즈 정리는 나이브 베이즈
Naive
Bayes
라고 부르는 잘 알려진 머신러닝 알고리즘에서 중요한 역할을 합니
다. 자세한 내용이 궁금하다면 조엘 그루스의 저서 『밑바닥부터 시작하는 데이터 과학』(인사이트,
2020
)을 살
펴보세요.
2
2.2.4
결합 및 합 조건부 확률
결합 확률을 다시 살펴보고 조건부 확률과 어떻게 상호 작용하는지 생각해봅시다. 전체 인구
중 암에 ...