Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.10
 詳細:多様体学習
457
PCA
と比較して多様体学習の唯一の明確な利点は、データの非線形の関係を保てることです。
そのため筆者は最初に
PCA
でデータの探索を行った後でのみ、多様体学習を試します。
Isomap
LLE
以外にも多様体学習の広く使用されているさまざまなバリエーションを
scikit-
learn
は実装しています。
scikit-learn
のドキュメントでは、それらについての素晴らしい解説と比
較があります(
http://scikit-learn.org/stable/modules/manifold.html
)。筆者の経験から、以下を推
薦します。
S
カーブのような簡単な事例では、局所的線形埋め込み(
LLE
)およびその変形(特に改良
LLE
)が非常に良好に機能します。これは
sklearn.manifold.LocallyLinearEmbedding
で実装
されています。
現実のソースから
の高次元データの場合、
LLE
はしばしば結果が悪く、等尺性マッピング
Isomap
)が一般的に意味のある埋め込みにつながるようです。これは
sklearn.manifold.
Isomap
に実装されています。
度にク スタ化 れたデ は、t分 の確率 近傍埋 込み
t-SNE
t-distributed
stochastic neighbor embedding
)が非常にうまく扱えますが、他の手法と比較してパフォーマ
ンスは劣ります。これは
sklearn.manifold.TSNE ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other