
36 2 章 数学の基礎知識の準備
一般に、訓練データに対する正確度が最高になったモデルは、正しいモデルとして世界に向けて誇ら
しげ
に提出される。しかし、モデル間の小さな性能の差は、知恵の問題ではなく、訓練データ/検証
データの選択方法やパラメータの最適化の成否による単純なばらつきとして扱われることが多い。
機械学習モデルの訓練ではこのことを忘れないようにしよう。私は、性能にわずかな差がある複数の
モデルの中からどれかを選ぶように求められると、スコアが最高のものよりも、最も単純なものを選
ぶことが多い。100 人にコイン投げの結果を予測してもらえば、誰かが最も正確な答えを出すことは
間違いない。しかし、だからといってその人が他の人よりも優れた予測能力を持っているとは誰も思
わない。
2.2.4 分布の特徴の説明
分布では、必ずしも平均の位置に大きな確率質量(probability mass)があるとは限らない。1 億ドル借り
てから、裏表が同率のコイン投げにその全額を賭けたとする。表が出れば借金なしになるが、裏が出ればさ
らに 1 億ドルの借金になる。増える財産の期待値はゼロである。しかし、この平均はあなたの財産の分布の
型をうまく表す形状とは言えない。
しかし、平均と標準偏差の両方があれば、あらゆる分布の特徴をそこそこのレベルまで示すことができ
る。平均からかけ離れた位置に比較的小さな確率質量があるだけで、標準偏差は大きく増えるため、σ が小
さければ、確率質量の大半が平均の近くに集まっていると考えられる。 ...