
67
3
章
次元削減
本章では、機械学習応用システムを構築する際に問題となる点の
1
つである、「次元の呪い」に焦点を
当てる。教師なし学習には、これに対抗する有効な手段がある。次元削減(
dimensionality reduction
)
だ。本章では次元削減を紹介し、その動作を直感的に理解するための応用例を示す。
「4章 異常検出」では、次元削減に基づく教師なし学習を用いたシステムを構築する。具体的には
教師なし学習に基づくクレジットカードトランザクション不正検出システムを構築する(「2章 機械学
習プロジェクトのはじめから終わりまで」で構築したのは教師あり学習に基づいたものだった)。この種
の教師なし学習による不正検出は異常検出とも呼ばれ、急速に成長している教師なし学習の応用分野
だ。
異常検出システムを構築する前に、まず本章で次元削減を学んでおこう。
3.1
次元削減を行う動機
「1 章 機械学習エコシステムにおける教師なし学習の立ち位置」で述べた通り、次元削減を用いると
機械学習でよく問題になる現象、「次元の呪い」に対抗することができる。「次元の呪い」とは、特徴量
空間が膨大になると機械学習アルゴリズムが効率的に学習できなくなる現象だ。
次元削減アルゴリズムは、高次元のデータを低次元空間に射影する。その際に冗長な情報を削除し
つつ可能な限り重要な情報を残すようにする。データを低次元空間で表現できれば、ノイズを低減し
たことになる。すると、機械学習アルゴリズムでより効率的に興味深いパターンを識別できる。