
from Scratch
83
확률 법칙은 일반적으로 보면 굉장히 맞지만, 구체적으로 보면 굉장히 틀리다.
- 에드워드 기본(
Edward
Gibbon
)
확률 및 관련된 수학적 지식을 어느 정도 갖추지 않고 데이터 과학을 하는 것은
매우 어렵다. 통계를 다룬
5
장과 비슷하게, 이번에는 확률과 관련된 수많은 기술
은 생략하고 기초적인 내용만 다뤄 보자.
확률(
probability
)이란 어떠한 사건의 공간에서 특정 사건이 선택될 때 발생하
는 불확실성을 수치적으로 나타내는 것이다. 정의를 더 구체적으로 설명하기보
다 주사위 던지기를 예시로 살펴보자. 사건의 공간은 주사위를 던졌을 때 나올
수 있는 모든 결과로 이루어져 있다. 이 공간의 부분 집합을 하나의 사건으로 볼
수 있다. 예를 들어 ‘주사위를 던져서
1
이 나오는 경우’ 혹은 ‘주사위를 던져서 짝
수가 나오는 경우’를 하나의 사건으로 볼 수 있다.
여기서는 위와 같은 사건
E
에 대한 확률을
P(E)
라고 표시하자.
우리는 다양한 모델을 만드는 데 확률을 사용할 예정이며, 모델의 성능을 평
가하는 데도 확률을 사용할 것이다. 여기서 우리는 확률을 온갖 목적으로 사용
할 것이다.
만약 누군가 원한다면 확률 이론의 깊은 철학에 대해 논의해 볼 수도 있다(이
런 얘기는 맥주를 마시면서 얘기하는 걸 추천한다). 하지만 이 책에서 그런 ...