25
2 章
数学の基礎知識の準備
データサイエンティストとは、計算機科学者よりも統計学を理解し、
統計学者よりも計算機科学を理解している人のことである。
— ジョシュア・ブルームンストック
歩けるようにならなければ走ることはできない。同じように、数値データで意味のあることができるとい
う信頼を得るためには、一定レベルの数学的知識がなければならない。
私は読者が、確率、統計、線形代数、微分積分を履修済みであるという前提で執筆した。そして、読者が
習ったことの大半を忘れていること、あるいは細々とした木(定義、証明、操作の細部)に気を取られすぎ
て森(定義等が重要な理由やそれらの用途)を見ることができていないということを前提としている。
この
章では、数学の基本概念の一部について、読者の理解を呼び覚まそうと思う。本の流れに従って読
み、あとで参考書として必要だと思うなら、昔使った教科書を引っ張り出してこよう。あとの章で深い知識
が必要になった際は、随時説明していく。
2.1 確率
確率論は、事象の
ゆ う ど
尤度 を推論するための形式的な枠組みを提供する。確率論は確立された学問分野なの
で、推論するものを正確に示すためには、相互に絡み合った複数の定義が必要となる。
• 試行とは、発生し得る結果の 1 つを生み出す手続きのことである。これから使い続けていく例とし
て、赤と青の 2 個のサイコロを振る試行について考えてみよう。それぞれのサイコロは 6 面で、整数
{1, . . . , 6}のいずれかの目が出る。
• 標本空間 S は、取り得る試行結果の集合である。このサイコロの例では、36 種類の結果を取り得る。
具体的には次の通り。
S ={(1, 1), (1, 2), (1, 3), (1, 4), (1, 5),