
7.1 モデリングの哲学 187
での性能よりもはるかに良いモデルはオーバーフィッティングしている
*
1。
今後の課題
最初
の原則や想定に忠実なモデルはバイアスのためにアンダーフィッティングしがちなのに対
し、データ駆動型のモデルはオーバーフィッティングの危険が高くなる。
7.1.3 ネイト・シルバーならどうするか
今日 のデ ータ サイ エン スで 、多く のア メリ カ人 に 知ら れて いる のは 、ネイ ト・シル バーだ ろう 。
彼は経 営コンサ ルタント の 仕事を捨 てて野球 の予想シ ステムを 開 発し、選挙 予想サイ トの https:
//fivethirtyeight.com/ で名声を築いた。彼は定量的な方法を使って選挙結果を分析し、アメリカ
大統領選挙の結果を予測してきた。2008 年の選挙では 50 州のうち 49 州の勝者を当て、2012 年には 50 州
全部を当てた。2016 年の選挙はほぼ全員が驚く結果になったが、トランプが一般投票では負けながら、選
挙人団を獲得する可能性がかなりあるということを言っていたのは、パブリックコメンテーターの中でただ
1 人、ネイト・シルバーだけだった。そして実際に起きたのはその通りのことだった。
シルバーは、The Signal and the Noise: Why so many predictions fail – but some don’t (邦題『シグナル&
ノイズ 天才データアナリストの「予測学」』)[Sil12] というすばらしい ...