
138 5 章 統計分析
図 5 -19 ベイズの定理の実際
5.7 さらなる探求のために
デ
ータサイエンティストは全員、統計学入門の授業を取らなければならない。代表的な教科書は、
Freedman [FPP07] と James et al. [JWHT13] である。Wheelan [Whe13] は初歩的なことをわかりやすく書
いており、Huff [Huf10] は「統計でうまく嘘をつく方法」という古典的なテーマを扱っている。
Donoho [Don15] は、統計学という古典的な学問の立場から見た魅力的なデータサイエンス史である。こ
の本は、今日のデータサイエンスの大原則の大半が統計学者によって築かれたものであるが、統計学はそれ
らをすぐには支持しなかったということをうまく説明している。しかし、両者の関心が互いに近づいてきた
ことにより、現代の統計学者は以前よりもずっと満足できる形で計算機科学者と対話できるようになってき
ている。
Vigen [Vig15] は、膨大な数の面白い時系列データから擬似相関する面白い組合せを集めている。図 5 -10
はその代表的なもので、許可を得て転載している。
アメリカの世帯の規模は、ポワソン分布にまずまず適合していることが示されている。実際、104 の国々
の世帯規模の分布を分析すると、世界中で前述の「もうたくさん」モデル(117 ページ)が働いているらし
いことがわかる。
5.8 演習問題
統計分布
5-1. [5] 次の現象を説明するために最も適している分布は、二項分布 ...