185
7 章
数理モデル
すべてのモデルは間違っているが、中には役に立つものもある。
— ジョージ・ボックス
本書ではこれまでに、データを操作、解釈するためのさまざまな手法について述べてきた。しかし、モデ
リング、すなわち予測や予知ができるツールに情報を集約するプロセスについてはまだ取り扱っていない。
予測モデルは、将来あるできごとが起こる原因を、何らかの考え方をもとに作る。最近のトレンドや観測
値の延長線上で予測を立てる方法は、未来も過去と同じようなものだという考えを前提としている。物理法
則などのより高度なモデルは、因果関係についての原理的な概念、ものごとがなぜ起こるかについての根本
的な説明を与えてくれる。
この章では、モデルの設計と評価について考える。効果的なモデルを作るためには、どのような選択が可
能であるかを詳細に理解する必要がある。
モデルの性能の正確な評価は驚くほど難しいが、モデルが生成した予測を解釈するためには、性能評価は
必須である。最も優れた予測システムは、必ずしも最も正確な予測システムではない。境界、限界が最もよ
くわかっているモデルが最も優れている。
7.1 モデリングの哲学
技術者や科学者は、哲学に警戒心を持つことが多い。しかし、自分たちが何をしようとしているのか、な
ぜそ
うしようとしているのかについて根本的なことを考えれば、それなりに利点がある。データサイエン
ティストに期待されることは、プログラムではなく知恵であることを忘れないようにしよう。
この節では、モデル構築の方法論を形成するために、モデルについてのさまざまな考え方に触れることに
しよう。
7.1.1 オッカムの剃刀
オッカムの剃刀とは、「最も良い説明は最も単純な説明だ」という哲学的な原則のことである。14 世紀の
神学者オッカムは、同じくらい正確な予測ができる ...