book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池彰

May 2018

Intermediate to advanced

556 pages

13h 21m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

456

章機械学習

図5-103　局所線形埋め込みによる非線形に埋め込まれた入力からの元データ復元

結果は元の多様体に比べて多少歪みがありますが、データの本質的な関係を捉えています。

5.10.6

多様体学習に対する考察

ここまでの事例には説得力がありましたが、実際のところ多様体学習の手法は多少難解な点もあ

るため、高次元データの単純で定性的な可視化以外で使用することはあまりありません。

以下は、多様体学習に関するさまざまな課題であり、

PCA

と比較して劣っていると考えられる

点です。

●

多様体学習には、欠損データを処理するための良いフレームワークがありません。対照的に、

PCA

には欠落データに対する直接的かつ反復なアプローチがあります。

●

多様体学習では、データにノイズが存在すると多様体を「短絡」させ、埋め込みを大幅に変化

させます。対照的に、

PCA

は、最も重要な成分からノイズを自然に除去します。

●

多様体学習の一般的な埋め

込み結果は選択された近傍の数に大きく依存しますが、最適な数

の近傍を選択するための一般的な定量的方法は存在しません。対照的に、

PCA

はそのような

選択が必要ありません。

●

多様体学習では、最適な出力次元の数を決定することは困難です。対照的に、

PCA

では因子

寄与率に基づいて最適な出力次元を見つけることができます。

●

多様体学習において、埋め込まれた次元の意味は必ずしも明確ではありません。一方

PCA

で

は、主成分は非常に明確な意味を持ちます。

●

多様体学習の計算コストは

[

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Pythonデータサイエンスハンドブック第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池彰

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田秀基

PythonによるAIプログラミング入門 ―ディープラーニングを始める前に身につけておくべき15の基礎技術

Prateek Joshi, 相川愛三

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other