Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
7.2 モデルの用語 189
なる。
A は人
x が実際にテロリストであるという事象、B x がテロリストに見えるかどうかを判断す
る特徴ベースの分類器の分類結果とする。1, 000 人分のデータセット(そのうちの半分がテロリス
ト)で訓練、評価した結果、分類器は 90 % という羨ましいほどの正確度を実現した。そして、分類
器がスキーナ(著者)はテロリストのように見えると言っている。では、スキーナが本当にテロリス
トである確率はいくつだろうか。
ここで重要なのは、「x がテロリストである」事前確率が非常に低いことである。アメリカ国内で活
動しているテロリストが 100 人であるとすると、P (A) = 100/300, 000, 000 = 3.33 × 10
7
である。
分類器がテロリストだと答える確率 P (B) = 0.5 で、分類器がテロリストと答えたとき、分類器の正
しい確率は P (B | A) = 0.9 である。これらを掛け合わせると次のようになる。
P (A | B) =
P (B | A)P (A)
P (B)
=
(0.9)(3.33 × 10
7
)
(0.5)
= 6 × 10
7
私がテロリストである確率は、無作為に抽出した市民がテロリストである確率よりも高くなるが、本
当のテロリストである確率は依然としてかなり低い。
この分類器を正しく解釈するためには、事前確率を考慮に入れることが欠かせない。ベイズ推論は事
前確率からスタートし、新たな証拠が事象の確率にどれくらい強く影響を与えるかを評価して結論を ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other