Skip to Content
Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
February 2024
Intermediate to advanced
576 pages
9h 17m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

46章詳細:多様体学習

前の章では、PCAで次元削減を行い、ポイント間の本質的な関係を維持しながらデータセットの特徴数を削減する方法を学びました。PCAは柔軟かつ高速で、解釈は簡単ですが、データ内に非線形の関係がある場合はあまりうまく機能しません。その例を、この後で説明します。

この欠点に対処するために、多様体学習アルゴリズムを使用します。これは教師なし学習の一種で、データセットを高次元空間に埋め込まれた低次元の多様体として記述しようとするものです。多様体とは、例えば1枚の紙です。これは、我々の身近な3次元の世界に存在する2次元の物体です。

多様体学習の観点では、この紙は3次元空間に埋め込まれた2次元多様体と考えることができます。3次元空間で紙を回転させても、方向を変更しても、または引き伸ばしても、平面であることに変わりはありません。この操作は線形埋め込みと似ています。紙を曲げたり、丸めたり、ねじったりする場合、2次元の多様体であることに変わりはありませんが、3次元空間への埋め込みはもはや線形ではありません。3次元空間を埋めるように歪曲されていても、多様体学習アルゴリズムで学習を行い、紙の基本的な2次元的性質を探し出せます。

ここでは、数ある多様体学習手法の中から、特に多次元尺度構成法(MDS:multidimensional scaling)、局所線形埋め込み(LLE:locally linear embedding)、等尺性マッピング(Isomap:isometric mapping)について深く掘り下げます。

はじめに標準的なモジュールをインポートします。

In [1]: %matplotlib inline import matplotlib.pyplot as plt ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
推薦システム実践入門 ―仕事で使える導入ガイド

推薦システム実践入門 ―仕事で使える導入ガイド

風間 正弘, 飯塚 洸二郎, 松村 優也
プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

Matt LeMay, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 高橋 一貴

Publisher Resources

ISBN: 9784814400638Publisher Website