
40 2 章 数学の基礎知識の準備
2.3.2 相関の有意性と予測力
相関
係数 r は、与えられた標本 S で、x が y の予測のためにどの程度使えるかを示す。|r| が 1 に近けれ
ば近いほど、良い予測が得られる。
しかし、本当の問題は、標本の枠を抜け出して実世界に飛び込んだときに、この相関がどの程度維持でき
るかだ。強い相関があると言うためには、|r| が大きいというだけでなく、有意と言えるくらい多くの標本
がなければならない。データを線形適合させたければ、標本を 2 つの点に絞ることだという皮肉な言い方が
ある。根拠となる点が多ければ多いほど、相関は明確になる。
強さと標本サイズに基づいて相関が統計的に有意であるための限界を示すと、図 2 -8 のようになる。
• 決定係数 r
2
:標本の相関係数の 2 乗 r
2
は、Y を X の単純な線形回帰でどのくらい説明できるかを
表す値である
*
9。
図 2 -8(左)は、r が小さくなると、r
2
がいかに急激に小さくなるかを示している。ただし、相関が
あるといっても、弱い相関には注意が必要だ。相関が 0.5 になると予測力は最大のときの 25 % に下
がり、0.1 になるとわずか 1 % になってしまう。このように、r が小さくなると、予測力はそれより
も急激に低下する。
「分散を説明する」とはどのような意味だろうか。x から予測される y の値を f(x) = mx + c と
する。予測が標本に最もよくフィットするような m と c を選べば、図 2