book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池彰

May 2018

Intermediate to advanced

556 pages

13h 21m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

5.9

詳細：主成分分析

443

分散の

％は

個の主成分に相当します。次に、この主成分を使い、逆変換を行って数字を再

構成します（図 5-90）。

In[16]: components = pca.transform(noisy)

filtered = pca.inverse_transform(components)

plot_digits(filtered)

図5-90　PCAを使ってノイズを除去した手書き数字

この信号保存

ノイズフィルタリング特性により、

PCA

は非常に有用な特徴選択機能となりま

す。例えば、非常に高次元のデータで推定器の学習を行うのではなく、入力のランダムノイズを自

動的に除去するフィルタリングを通した低次元表示を使って推定器の学習を行います。

5.9.3

事例：固有顔画像

既にサポートベクターマシン（「5.7 詳細：サポートベクターマシン」）で

PCA

を使用して顔認識

のための特徴抽出を行いました。ここでは、もう少し詳しく調べてみましょう。

scikit-learn

から利

用可能な

Labeled Faces in the Wild

データセットを使用していたことを思い出してください。

In[17]: from sklearn.datasets import fetch_lfw_people

faces = fetch_lfw_pe

ople(min_faces_per_person=60)

print(faces.target_names)

print(faces.images.shape) ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Pythonデータサイエンスハンドブック第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池彰

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田秀基

PythonによるAIプログラミング入門 ―ディープラーニングを始める前に身につけておくべき15の基礎技術

Prateek Joshi, 相川愛三

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other