Skip to Content
データサイエンスのための統計学入門 第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング
book

データサイエンスのための統計学入門 第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング

by Peter Bruce, Andrew Bruce, Peter Gedeck, 黒川 利明, 大橋 真也
November 2020
Intermediate to advanced
396 pages
8h 34m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンスのための統計学入門 第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング
5.1
 ナイーブベイズ
207
probabilities = pd.DataFrame(naive_model.predict_proba(new_loan),
columns=loan_data[outcome].cat.categories)
print('predicted probabilities', probabilities)
predicted class: default
predicted probabilities
default paid off
0 0.653696 0.346304
予測では、返済不能の事後確率も推定する。ナイーブベイズ分類は、バイアスのあ
推定を行うことが知られている。しかし、目標が
Y
1
の確率に従って、レコードを
順位付けすることである場合、バイアスのない不偏推定確率は必要なく、ナイーブベイ
ズで良い結果が得られる。
5.1.3
 数値予測変数
定義から、ベイズ分類がカテゴリ予測変数でしかうまくいかない(例:スパム分類に
おいては、単語、句、文字などの存在あるいは欠如が、予測の核心を占める)のがわか
る。数値予測変数にナイーブベイズを適用するには、次の
2
つの方式のどちらかをとる。
ビン分けして数値予測変数をカテゴリ変数に変換し、前節のアルゴリズムを適用
する。
例えば、正規分布(「2.6 正規分布」参照)のような確率モデルを用い、条件付き
確率
P
(
X
j
| Y
i
)
を推定する。
訓練データに予測変数のカテゴリが存在しない場合、アルゴリズムは、他の ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

マスタリングLinuxシェルスクリプト 第2版 ―Linuxコマンド、bashスクリプト、シェルプログラミング実践入門

マスタリングLinuxシェルスクリプト 第2版 ―Linuxコマンド、bashスクリプト、シェルプログラミング実践入門

Mokhtar Ebrahim, Andrew Mallett, 萬谷 暢崇, 原 隆文

Publisher Resources

ISBN: 9784873119267Other