Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
7.4 モデルの評価 195
を望
むことはできないわけである。しかし、性能が高い理想の予測器でも性能の上限が下がるなら、
ベースラインモデルは思ったよりも手強いことがわかるだろう。
複数の人間が同じ事例を評価して訓練データを作ったときには、このように性能上限が下がることが
多い。複数の人間の判断が一致しなければ、否応なく矛盾を抱えることになる。私は、どんなにスコ
アを上げても 86.6% にしかならない問題に遭遇したことがある。教訓めいたことを言えば、人間に
はほとんど期待できないので、人間の関与を大幅に下げて努力する必要があることを認識すべきだ。
7.3.2 値予測問題のベースラインモデル
値を予測する問題では、特徴と値の対 (f
i
, v
i
) を集めたものを与えられ、F (v
i
) = f
i
になるように関数 F
を訓練する。値予測問題でも、次のように分類問題とよく似た技法でベースラインモデルを作る。
平均または中央値:特徴を無視し、全体の総意と言えるような値を必ず出力する。このベースライン
には意外に意味がある。いつも平均を返すような予測器と大差ない成績しか上げられない予測器しか
作れないなら、特徴に間違いがあるか、タスクが絶望的に不可能なものであることだ。
線形回帰9.1 節で詳しく説明するが、現段階では、線形回帰とは、値予測問題の正解に最も近い答
えを出せる線形関数を作るということ、使いやすいが強力な技法であることを覚えておけばよいだろ
う。このベースラインは、非線形モデルの性能の判断に適している。非線形モデルが線形判別よりも ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other