
7.2 モデルの用語 189
なる。
A は人
物 x が実際にテロリストであるという事象、B は x がテロリストに見えるかどうかを判断す
る特徴ベースの分類器の分類結果とする。1, 000 人分のデータセット(そのうちの半分がテロリス
ト)で訓練、評価した結果、分類器は 90 % という羨ましいほどの正確度を実現した。そして、分類
器がスキーナ(著者)はテロリストのように見えると言っている。では、スキーナが本当にテロリス
トである確率はいくつだろうか。
ここで重要なのは、「x がテロリストである」事前確率が非常に低いことである。アメリカ国内で活
動しているテロリストが 100 人であるとすると、P (A) = 100/300, 000, 000 = 3.33 × 10
−7
である。
分類器がテロリストだと答える確率 P (B) = 0.5 で、分類器がテロリストと答えたとき、分類器の正
しい確率は P (B | A) = 0.9 である。これらを掛け合わせると次のようになる。
P (A | B) =
P (B | A)P (A)
P (B)
=
(0.9)(3.33 × 10
−7
)
(0.5)
= 6 × 10
−
7
私がテロリストである確率は、無作為に抽出した市民がテロリストである確率よりも高くなるが、本
当のテロリストである確率は依然としてかなり低い。
この分類器を正しく解釈するためには、事前確率を考慮に入れることが欠かせない。ベイズ推論は事
前確率からスタートし、新たな証拠が事象の確率にどれくらい強く影響を与えるかを評価して結論を ...