
145
145
5.7 カテゴリデータの相関統計量
−
1
)。
2
×
2
の表では、クラメールの
V
の式はファイの
2
つ目の式と同じである。
n
が
200
の
3
×
4
の表のカイ二乗値が
16.70
であるとする。このデータのクラメールの
V
を式
5-17
に示す。
式
5-17
クラメールの
V
の計算
5.7.2
点双列相関係数
点双列相関係数は、二値変数と連続変数の関連尺度である。数学的には(
7
章で詳しく説
明する)ピアソンの相関係数と同等であるが、一方の変数が二値変数なので、異なる式を使っ
て計算する。
性別(二値)と成人身長(連続)の関連の強さを求めたいとする。点双列相関はピアソン
の相関係数のように対称であるが、表記を簡単にするために、身長を
X
、性別を
Y
で示し、
Y
の符号は
0
=男性、
1
=女性とする。男女の標本を抽出し、式
5-18
に示す式を使って点双
列相関を計算する。
式
5-18
点双列相関係数の式
この式では、
1
=女性の平均身長、
0
=男性の平均身長、
p
=女性の割合、
s
x
=
X
の
標準偏差である。
この標本では、男性の平均身長は
69.0
インチ、女性は
64.0
インチ、身長の標準偏差は
3.0
インチ、標本の
55%
が女性であるとする。性別と成人身長の相関は、式
5-19
に示すように
計算する。
式
5-19
性別と身長の点双列相関
−
0.829
の相関は強い関係であり、米国人口において性別と成人身長には密接な関係があ
ることを示している。相関が負なのは、女性(平均身長が低い)を
1
、男性を
0
と符号化し