지금까지 살펴본 정규 분포는 실숫값(스칼라) 하나짜리가 대상이었습니다. 예를 들어 키의 분
포를 정규 분포로 표현할 때는 관측값의 대상이 키 하나뿐이었습니다. 다음으로 생각해볼 문제
는 실숫값 여러 개로 구성된 벡터의 정규 분포입니다. 다음처럼 원소가 키와 몸무게인 벡터를
생각해봅시다.
이렇게 벡터로 정리하면, 예를 들어
A
씨는 (
175cm
,
50kg
)이고
B
씨는 (
160cm
,
53kg
)이라
는 측정 데이터를 얻을 수 있습니다. 이러한 벡터로 구성된 데이터 분포를 정규 분포로 표현해
보는 것이 이번 주제입니다(그림
3
-
5
).
그림
3-5
1차원 정규 분포(왼쪽)와 2차원 정규 분포(오른쪽)의 예
확률 밀도
몸무게(kg)
키(cm)키(cm)
왼쪽 그림은
1
차원 정규 분포이고 오른쪽은
2
차원 정규 분포입니다. 여기서 말하는 차원은 벡
터의 차원을 뜻합니다. 스칼라는
1
차원 벡터로 볼 수 있으므로 스칼라를 대상으로 하는 정규
분포를
1
차원 정규 분포라고 부를 수 있습니다.
3.2.1
다변량 정규 분포 공식
이번 절에서 다룰 확률 변수
x
의 형태는 다음과 같습니다.
82
밑바닥부터 시작하는 딥러닝 5
x
는
D
개의 확률 변수를 모아놓은 벡터입니다. 또한
x
는 분포가 같은
D
개의 독립적인 샘플이
아닙니다.
x
의 각 원소는 (
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.