October 2025
Intermediate to advanced
328 pages
3h 56m
Japanese
本書で探究してきたデータセットでは、人やペンギンのグループ間の違い、変数間の相関、回帰直線の傾きなどを見てきました。このような結果は観測効果と呼ばれます。観測効果は、直接観測できない母集団における実際の効果とは対照的に、標本に現れるものです。明らかな効果が見られる場合、それがより大きな集団に存在する可能性が高いのか、それとも偶然標本に現れたのかを検討する必要があります。
この問題を定式化する方法はいくつかあり、フィッシャーの帰無仮説検定、ネイマン・ピアソンの決定理論、ベイズ仮説検定などがあります。ここで紹介するのは、実務でもよく用いられるこれらの手法の組合せです。
簡単な例から始めましょう†1。2002年にユーロ硬貨が導入されたとき、好奇心旺盛なコイン愛好家がベルギーの1ユーロ硬貨を250回転がしたところ、表が140回、裏が110回出ました。コインの偏りがまったくなければ、表は125回しか出ないと予想されるので、このデータはコインが偏っていることを示唆しています。一方、毎回正確に125回の表が出るわけないので、コインは実際には偏りがなく、期待値からの明らかな差は偶然によるものである可能性もあります。それが妥当かかどうかを確かめるために、仮説検定を行います。
[†1] D. J. MacKay, Information Theory, Inference and Learning Algorithms (Cambridge University Press, 2003)の例に基づく。
次の関数を使い、コインが偏りがない場合の観測された値と期待値との差の絶対値を計算します。
n = 250p = 0.5def abs_deviation(heads): ...
Read now
Unlock full access