
184
7 章 ピアソンの相関係数
7.3
ピアソンの相関係数
散布図は変数同士の関係を調べるために重要な視覚ツールである。有意性を調べたり、関
係性の統計的推測をしたいときもある。間隔や比尺度レベルの
2
変数において、関係性の最
も一般的な尺度はピアソンの相関係数であり、積率相関係数(
product-moment correlation
coefficient
)とも呼ばれ、母集団ではρ(ギリシャ文字のロー)、標本では
r
で書かれる。
ピアソンの
r
は
(
−
1, 1)
の範囲を動く。
0
は変数間に関係がないことを示し、絶対値は変
数同士の関係性の強さを示す(どちらの変数も図
7-5
や図
7-6
のような定数ではないと仮定
する)。ピアソンの
r
値は、データが非線形関係だと、誤解を生む。それこそがデータをグラ
フ化する理由となる。「強い」や「弱い」といった言葉には厳密な数値的定義はないが、「強い」
関係性は「弱い」関係性よりも線形関係である。つまり、強い関係性ではより多くの点が直
線の近くに集まっている。「強い」や「弱い」の定義には調査や実践の場による変動もあるため、
自身の分野での慣習を学ぶ必要がある。異なる強さがどんなものかについて、異なる
r
値の
散布図のいくつかの例を図
7-11
、図
7-12
、図
7-13
に示す。
図
7-11
散布図(
r
=
0.84
)
0
0
10
20
30
40
5 10 15 20