
392
5
章 機械学習
象的です。非常に単純なアルゴリズムであっても、慎重に使用し、高次元の大きなデータセットで
学習したならその結果は驚くほど効果的となります。
5.5.4
ナイーブベイズをいつ使うべきか
ナイーブベイズ分類器はデータ対して単純な仮定をするため、複雑なモデルと同じようには機能
しません。とは言うものの、いくつかの利点があります。
●
学習と予測のどちらも非常に高速です
●
わかりやすい確率的予測を提供します
●
多くの場合で、非常に解釈が簡単です
●
調整可能なパラメータが非常に少数です
これらの利点は、最初に使用する分類器として、ナイーブベイズ分類器が良い選択であることを
意味します。それがうまく働くのであれば、非常に高速で非常にわかりやすい分類器が得られたこ
とになります。うまくいかない場合は、より洗練されたモデルの調査を始めましょう。どうなれば
良いのか、その基準とすべき知識は、ナイーブベイズ分類器の結果から既に
得られています。
ナイーブベイズ分類器は、次のような状況に対して特に優れています。
●
単純な仮定がデータと一致する場合(実際には非常にまれです)
●
モデルの複雑性がそれほど重要ではなく、カテゴリが非常によく分離されている場合
●
モデルの複雑性がそれほど重要ではなく、データの次元が非常に高い場合
最後の
2
つは異なるように見えますが、実際には関連しています。データセットの次元が拡大す
るにつれて、
2
つの点が近くにある可能性は低くなります(結局、
2
つの点がすべての次元で近くに
なけ