book

データサイエンスのための統計学入門第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング

by Peter Bruce, Andrew Bruce, Peter Gedeck, 黒川利明, 大橋真也

November 2020

Intermediate to advanced

396 pages

8h 34m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from データサイエンスのための統計学入門第2版 ―予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング

5.1

ナイーブベイズ

■

207

probabilities = pd.DataFrame(naive_model.predict_proba(new_loan),

columns=loan_data[outcome].cat.categories)

print('predicted probabilities', probabilities)

predicted class: default

predicted probabilities

default paid off

0 0.653696 0.346304

予測では、返済不能の事後確率も推定する。ナイーブベイズ分類は、バイアスのあ

る推定を行うことが知られている。しかし、目標が

＝

の確率に従って、レコードを

順位付けすることである場合、バイアスのない不偏推定確率は必要なく、ナイーブベイ

ズで良い結果が得られる。

5.1.3

数値予測変数

定義から、ベイズ分類がカテゴリ予測変数でしかうまくいかない（例：スパム分類に

おいては、単語、句、文字などの存在あるいは欠如が、予測の核心を占める）のがわか

る。数値予測変数にナイーブベイズを適用するには、次の

つの方式のどちらかをとる。

●

ビン分けして数値予測変数をカテゴリ変数に変換し、前節のアルゴリズムを適用

する。

●

例えば、正規分布（「2.6　正規分布」参照）のような確率モデルを用い、条件付き

確率

(

| Y

＝

)

を推定する。

訓練データに予測変数のカテゴリが存在しない場合、アルゴリズムは、他の ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

マスタリングLinuxシェルスクリプト第2版 ―Linuxコマンド、bashスクリプト、シェルプログラミング実践入門

Mokhtar Ebrahim, Andrew Mallett, 萬谷暢崇, 原隆文

マイクロインタラクション ―UI/UXデザインの神が宿る細部

Dan Saffer, 武舎広幸, 武舎るみ

並行プログラミング入門 ―Rust、C、アセンブリによる実装からのアプローチ

高野祐輝

データベースリライアビリティエンジニアリング ―回復力のあるデータベースシステムの設計と運用

Laine Campbell, Charity Majors, 八木和生

Publisher Resources

ISBN: 9784873119267Other