Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
11.3 ブースティングとアンサンブル学習 333
正しさ(%)
良の重み
項目/投票者
多数派 最良の重み
% % % % % % %
11 -5
べての分類器が同じ程度に正確でも、1 票の重みを同じにしたのでは、必ずしも最良の分類器
が得られるとは限らない。一部の問題(この場合は D E)が他の問題よりも難しいからだ。な
お、
は、分類器がその要素を正しく分類したことを示す。
は、2 つのクラスはそれぞれ 0 1 である。個々の分類器が出力した 0 または 1 という結果は、実際のクラ
スを予測するための特徴として使える。この方法は、正解との相関性が高い分類器を重視した形の重みが得
られるが、正しい分類の数を明示的に最大化しようとするわけではない。
11.3.2 ブースティングアルゴリズム
3 の方法は、ブースティングである。ポイントは、正解するのが難しい事例に高い重みを付け、正解数
だけではなく、正解した事例の重みに基づいて分類器に報酬を与える。
分類器の重みを決めるために、訓練データの重みを調整する。簡単な訓練データとは、ほとんどの分類器
が正しく分類できる訓練データのことである。難しい訓練データを正しく分類できた分類器には、高い報酬
を与える。
代表的なブースティングアルゴリズムは、図 11 -6 に示すアダブーストである。本書では、細部、特に各
回における重み調整の具体的な方法には深入りしない。全体の分類器は、「v
i
t
i
か?」という形式の部品
の非線形分類器、つまり特徴のしきい値による分類器の和として作られるものとする。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other