
108
4
章 異常検出
図 4-12 スパースランダム射影による27成分を用いた場合の結果
ガウス型ランダム射影の結果はいまひとつだった。別の次元削減手法を用いた異常検出を見てみよ
う。
4.7
非線形異常検出
ここまでは、通常の
PCA
、スパース
PCA
、ガウス型ランダム射影、スパースランダム射影といった
線形の次元削減手法を用いた次元削減システムを構築してきた。非線形版の
PCA
であるカーネル
PCA
を用いたシステムも作った。
これまでの範囲では、
PCA
を用いたものが他のものよりもずっと良かった。
ここで非線形次元削減アルゴリズムに行きたいところだが、オープンソース版のこれらのアルゴリズ
ムは遅すぎるため、高速な不正検出システムを実装するには適さない。非線形次元削減はスキップし
て、距離に基づかない次元削減手法に進もう。辞書学習と独立成分分析(
ICA
)を 取 り 上 げ る 。
4.8
辞書学習による異常検出
辞書学習を用いて不正検出システムを構築してみよう。辞書学習は元データのスパースな表現を学
習することを思い出そう。元データの個々の観測点は、学習した辞書のベクトルの重み付き和として再
構成できる。
異常検出に用いるので、元の次元数よりも辞書のベクトル数が少なくなるように、未完備な辞書を
学習する。このような制約を与えることで、頻繁に発生する正常なトランザクションは再構成されやす
く、よりまれな不正トランザクションは再構成されにくくなる。
ここでは、
28
ベクトル(もしくは成分)を生成する。辞書の学習には、
200 ...