
254
|
第
7
章
(
p
×
(
p
–1))/2
个协方差项。协方差矩阵中一共有
(
p
×
(
p
–1))/2 +
p
个参数。多元正态分布表
示如下:
12
( , , , )~ ( , )
pp
XX X N
µ
∑
这就是所有变量都服从正态分布的符号表示方法。总体分布由变量均值向量与协方差矩阵
描述。
图
7-10
给出了两个变量
X
和
Y
的多元正态分布的概率等高线(例如,
0.5
的等高线中包含
50%
的数据分布)
。
图 7-10:二维正态分布的概率等高线
均值为
μ
x
=
0.5
,
μ
y
=
–0.5
,协方差矩阵为:
因为协方差
σ
xy
为正,所以
X
和
Y
是正相关的。
7.4.2
混合正态分布
基于模型的聚类方法的关键思想是,假定每条记录都服从于
K
个多元正态分布中的一个分