Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
392
5
章 機械学習
象的です。非常に単純なアルゴリズムであっても、慎重に使用し、高次元の大きなデータセットで
学習したならその結果は驚くほど効果的となります。
5.5.4
 ナイーブベイズをいつ使うべきか
ナイーブベイズ分類器はデータ対して単純な仮定をするため、複雑なモデルと同じようには機能
しません。とは言うものの、いくつかの利点があります。
学習と予測のどちらも非常に高速です
わかりやすい確率的予測を提供します
多くの場合で、非常に解釈が簡単です
調整可能なパラメータが非常に少数です
これらの利点は、最初に使用する分類器として、ナイーブベイズ分類器が良い選択であることを
意味します。それがうまく働くのであれば、非常に高速で非常にわかりやすい分類器が得られたこ
とになります。うまくいかない場合は、より洗練されたモデルの調査を始めましょう。どうなれば
良いのか、その基準とすべき知識は、ナイーブベイズ分類器の結果から既に
得られています。
ナイーブベイズ分類器は、次のような状況に対して特に優れています。
単純な仮定がデータと一致する場合(実際には非常にまれです)
モデルの複雑性がそれほど重要ではなく、カテゴリが非常によく分離されている場合
モデルの複雑性がそれほど重要ではなく、データの次元が非常に高い場合
最後の
2
つは異なるように見えますが、実際には関連しています。データセットの次元が拡大す
るにつれて、
2
つの点が近くにある可能性は低くなります(結局、
2
つの点がすべての次元で近くに
なけ
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other