Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.9
 詳細:主成分分析
443
分散の
50
%は
12
個の主成分に相当します。次に、この主成分を使い、逆変換を行って数字を再
構成します( 5-90)。
In[16]: components = pca.transform(noisy)
filtered = pca.inverse_transform(components)
plot_digits(filtered)
図5-90 PCAを使ってノイズを除去した手書き数字
この信号保存
/
ノイズフィルタリング特性により、
PCA
は非常に有用な特徴選択機能となりま
す。例えば、非常に高次元のデータで推定器の学習を行うのではなく、入力のランダムノイズを自
動的に除去するフィルタリングを通した低次元表示を使って推定器の学習を行います。
5.9.3
 事例:固有顔画像
既にサポートベクターマシン(「5.7 詳細:サポートベクターマシン」)で
PCA
を使用して顔認識
のための特徴抽出を行いました。ここでは、もう少し詳しく調べてみましょう。
scikit-learn
から利
用可能な
Labeled Faces in the Wild
データセットを使用していたことを思い出してください。
In[17]: from sklearn.datasets import fetch_lfw_people
faces = fetch_lfw_pe
ople(min_faces_per_person=60)
print(faces.target_names)
print(faces.images.shape) ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other