Skip to Content
Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
May 2018
Intermediate to advanced
556 pages
13h 21m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
5.1
 機械学習とは?
345
1
次元の潜在変数を表す色が抽出され、螺旋に沿って一様に変化していることに注目してくださ
い。見た目の構造をアルゴリズムで検出できたことを示しています。これまでの例と同様に、次元
削減アルゴリズムは高い次元のデータに対して重要となります。例えば、
100
から
1,000
種類の特
徴を持つデータセット内の重要な関係を可視化することを考えてみてください。
1,000
次元のデー
タを可視化することは困難ですが、次元削減を使用してデータを
2
次元または
3
次元に縮小すれば
可視化が可能となります。
この後、重要な次元削減アルゴリズムとして、主成分分析(「5.9 詳細:主成分分析」を参照)
と、等尺性マッピング(
Isomap
)や局所線形埋め込み(
Locally Linear Embedding
)などの多様体学習
「5.10 詳細:多様体学習」を参照)を紹介します。
5.1.3
 まとめ
ここでは、機械学習の基本的なアプローチを、簡単な例を通して見てみました。実践において重
要となる細かい部分は省略しましたが、機械学習がどのような問題を解決できるかについて、基本
的な考え方が理解できたかと思います。
簡単にまとめます。
教師あり学習
ラベル付き学習データに基づいてラベルを予測するモデル
分類
2
つ以上の離散カテゴリへの分類ラベルを予測するモデル
回帰
連続ラベルを予測するモデル
教師なし学習
ラベルのないデータの構造を識別するモデル
クラスタリング
データ内のグループを検出して識別するモデル
次元削減
より高次元データ内の低次元構造を検出し識別するモデル ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873118413Other