
5.10
詳細:多様体学習
457
PCA
と比較して多様体学習の唯一の明確な利点は、データの非線形の関係を保てることです。
そのため筆者は最初に
PCA
でデータの探索を行った後でのみ、多様体学習を試します。
Isomap
と
LLE
以外にも多様体学習の広く使用されているさまざまなバリエーションを
scikit-
learn
は実装しています。
scikit-learn
のドキュメントでは、それらについての素晴らしい解説と比
較があります(
http://scikit-learn.org/stable/modules/manifold.html
)。筆者の経験から、以下を推
薦します。
●
S
カーブのような簡単な事例では、局所的線形埋め込み(
LLE
)およびその変形(特に改良
LLE
)が非常に良好に機能します。これは
sklearn.manifold.LocallyLinearEmbedding
で実装
されています。
●
現実のソースから
の高次元データの場合、
LLE
はしばしば結果が悪く、等尺性マッピング
(
Isomap
)が一般的に意味のある埋め込みにつながるようです。これは
sklearn.manifold.
Isomap
に実装されています。
●
高 度にク ラ スタ化 さ れたデ ー タ は、t分 布 の確率 的 近傍埋 め 込み(
t-SNE
:
t-distributed
stochastic neighbor embedding
)が非常にうまく扱えますが、他の手法と比較してパフォーマ
ンスは劣ります。これは
sklearn.manifold.TSNE ...