
274 9 章 線形回帰とロジスティック回帰
9.7.3 階層的な分類
多くのクラスが含まれる問題では、クラスを木(階層)構造にまとめて正確度と効率の両方の向上を狙う
とよいだろう。個々のカテゴリがリーフ(葉)ノードで表される二分木を作ったとする。個々の内部ノード
は、左の子孫と右の子孫を区別する分類器を表すことになる。
この
階層構造を使った新要素 x の分類は、ルートから始まる。ルート分類器で x を処理すると、x は左右
のどちらの部分木に属するかが返される。リーフノードに達するまで、1 段下に移って新しいノードの分類
器で x を分類し続けると、x に与えられるラベルが決まる。すべてのクラスと明示的に比較していれば c に
比例する時間がかかるが、この方法を使った場合の処理時間は、木の高さに比例、つまりクラス数 c の対数
に比例する時間で済む。このアプローチに基づく分類器は、決定木と呼ばれる。11.2 節では、決定木を詳し
く説明する。
この階層構造を、カテゴリに類似クラスが集まるように専門分野の知識を活用して構築したいものだ。こ
れには、(1) 分類ミスをしても類似するクラスのラベルが与えられる可能性が高くなることと、(2) 中間ノー
ドでは実際のラベルよりも正確に認識できる高次の概念を定義できること、の 2 つの利点がある。画像分類
問題の 100 種類のクラスの中に、「自動車」、「トラック」、「ボート」、「自転車」が含まれるとする。これら
のクラスが「乗り物」という中間ノードの子孫なら、このノードに向かうパスでは、低解像度で高正確度の ...