Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.14
 応用:顔検出パイプライン
505
In[19]: from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import cross_val_score
cross_val_score(GaussianNB(), digits.data, digits.target).mean()
Out[19]: 0.81860038035501381
このような生成的分類器の利点の
1
つは、結果の解釈容易性です。未知なる各サンプルに対して、
確率的な分類が得られるだけでなく、点の分布の完全モデルを得ることもできるのです。
SVM
ランダムフォレストなど手法を使った際に、アルゴリズムがいかなる理由でその分類を行ったの
か、その直感的な理由を示してくれます。
これをさらに進めたい場合のために、ここで作成し
KDE
分類器モデルに対していくつかの改
善点を挙げておきます。
各クラスのバンド幅を個別に変えられるようにする
バンド幅を予測スコアに基づくのではなく、各クラス内の生成モデル下での学習データの尤
度(すなわち、全体の予測精度ではなく、
KernelDensity
自体のスコアを使用する)に基づい
て最適化する
最後に、独自の推定器を構築する練習が必要なら、
KDE
の代わりにガウス混合モデルを使用し
て同様のベイズ分類器を構築してみることをお勧めします。
5.14
 応用:顔検出パイプライン
この章では、機械学習の中心的な概念とアルゴリズムについて学びました。しかし、こうしたコ ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other