
131
131
5.3 カイ二乗検定
Q
は自由度
k
のカイ二乗分布に従う。
覚えておくべき重要な点が
2
つある。カイ二乗値を評価するには自由度を知る必要があり、
一般に棄却値は自由度とともに増加する。
α
=
0.05
の場合、自由度
1
の片側カイ二乗検定
の棄却値は
3.84
であるのに対し、自由度
10
では
18.31
になる。
5.3
カイ二乗検定
カイ二乗検定は、
2
つ以上のカテゴリ変数の関係を調べる最も一般的な手段の
1
つである。
カイ二乗検定を実施するには、カイ二乗統計量を計算し、その値とカイ二乗分布の値を比較
して検定結果の確率を求める必要がある。カイ二乗検定にはいくつかの種類がある。特に明
記しない限り、本章では「カイ二乗検定」とはピアソンのカイ二乗検定を意味し、これが最
も一般的な種類である。
カイ二乗検定には
3
つのバージョンがある。
1
つ目は独立性に対するカイ二乗検定と呼ば
れる。
2
変数を調べるために、独立性に対するカイ二乗検定では変数が互いに独立である(つ
まり、変数間に関連がない)という帰無仮説を検定する。対立仮説は変数間に関連があり、
独立ではなく従属であるというものになる。
例えば、成人の無作為標本から喫煙状態と肺癌の診断に関するデータを収集する。各変数
は二値である。現在喫煙しているかしていないか、そして肺癌と診断されているか否かであ
る。このデータを表
5-3
に示す度数分布表に並べる。
表
5-3
喫煙状態と肺癌診断
肺癌診断 肺癌診断なし
現在喫煙
60 300
現在喫煙なし
10 390
このデータを見るだけで、喫煙と肺癌に関係があるのはもっともらしく思える。喫煙者の ...