
2.3 相関分析 37
独立
変数であることになる。相関係数が負数なら、両者には負の相関がある。つまり、X が増えるときに
Y は減る。
完全な負の相関がある場合、相関係数は −1 になる。予測という目的では、負の相関は正の相関と同じよ
うに良い条件であることに注意しよう。学歴が高ければ高いほど、失業の危険性が減るのは負の相関の例で
あり、学歴は職の有無の予測に役に立つ。相関係数が 0 の周辺であれば、予測には役立たない。
観測された相関は、データサイエンティストが作る予測モデルの多くに大きな影響を与える。相関の強弱
が話題になる代表的な例を挙げてみよう。
• 背の高い人の方が太らない傾向があるか? 身長と BMI(ボディマス指数:body mass index、肥満度
を表す)には、r = −0.711 の相関が観測されている。そのため、身長と BMI には実際に負の相関が
ある
*
4。
• 標準テストから大学入学後の学生の成績を予測できるか? SAT の得点と大学 1 年生の GPA には
r = 0.47 の相関が観測されているため、SAT の成績にはある程度の予測力がある。しかし、社会経
済的な状態にも SAT の得点と同程度の相関(r = 0.42)がある
*
5。
• 家計の状況は健康に影響を与えるか? 家計収入と心臓動脈疾患の有病率には r = −0.717 の負の相関
が観測されているため、両者には強い負の相関がある。そのため、裕福であればあるほど、心臓発作
に襲われるリスクは低くなる
*
6。
• 喫煙は健康に影響を与えるか? ...