
112 5 章 統計分析
我々も統計学者のような考え方を身に付けたいところだ。解釈のしすぎや誤りに警戒し、それらに注意し
ながらデータを操作し、結論を導くようにしたい。
5.1 統計的分布
我々が観測するすべての変数は、どれくらいの頻度で特定の値が現れるかという度数分布を形成する。身
長、体
重、IQ などの変数のユニーク(固有)な性質は、分布によって捉えることができる。しかし、こう
いった分布の形自体はユニーク(1 つだけ)ではない。世界にはさまざまなデータがあるが、その大部分は
少数の古典的な形を示す。
これら古典的な分布には、(1) 現実の世界でよく発生する度数分布の形を説明する、(2) ごく少数のパラ
メータによる閉形式を使って数学的に説明できる、という 2 つの好都合な性質がある。特定のデータの観測
を抽象化すると、その結果は独立して研究する価値のある確率分布になる。
古典的な確率分布を使いこなすことは大切だ。確率分布は現実世界でたびたび現れるので、いつも注意し
ておこう。また、確率分布は、データがどのようなものかを、より詳細に説明してくれる。以下の各節で
は、その本質を定義付ける性質を強調しながら、最も重要な確率分布(二項分布、正規分布、ポワソン分布、
べき乗則分布)を説明する。
観測したデータの分布の形がある特定の理論的な分布に似ているからといって、必ずしもその分布が現れ
ているとは限らない。統計的検定を使えば、実験的に観測されたデータが特定の分布から抽出された標本を
反映したものなのかどうかを厳密に証明することができる。 ...