Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
274 9 線形回帰とロジスティック回帰
9.7.3 階層的な分類
多くのクラスが含まれる問題では、クラスを木(階層)構造にまとめて正確度と効率の両方の向上を狙う
とよいだろう。個々のカテゴリがリーフ(葉)ノードで表される二分木を作ったとする。個々の内部ノード
は、左の子孫と右の子孫を区別する分類器を表すことになる。
この
階層構造を使った新要素 x の分類は、ルートから始まる。ルート分類器で x を処理すると、x は左右
のどちらの部分木に属するかが返される。リーフノードに達するまで、1 段下に移って新しいノードの分類
器で x を分類し続けると、x に与えられるラベルが決まる。すべてのクラスと明示的に比較していれば c
比例する時間がかかるが、この方法を使った場合の処理時間は、木の高さに比例、つまりクラス数 c の対数
に比例する時間で済む。このアプローチに基づく分類器は、決定木と呼ばれる。11.2 節では、決定木を詳し
く説明する。
この階層構造を、カテゴリに類似クラスが集まるように専門分野の知識を活用して構築したいものだ。こ
れには、(1) 分類ミスをしても類似するクラスのラベルが与えられる可能性が高くなることと、(2) 中間ノー
ドでは実際のラベルよりも正確に認識できる高次の概念を定義できること、の 2 つの利点がある。画像分類
問題の 100 種類のクラスの中に、「自動車」、「トラック」、「ボート」、「自転車」が含まれるとする。これら
のクラスが「乗り物」という中間ノードの子孫なら、このノードに向かうパスでは、低解像度で高正確度の ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other