
5.1
機械学習とは?
345
1
次元の潜在変数を表す色が抽出され、螺旋に沿って一様に変化していることに注目してくださ
い。見た目の構造をアルゴリズムで検出できたことを示しています。これまでの例と同様に、次元
削減アルゴリズムは高い次元のデータに対して重要となります。例えば、
100
から
1,000
種類の特
徴を持つデータセット内の重要な関係を可視化することを考えてみてください。
1,000
次元のデー
タを可視化することは困難ですが、次元削減を使用してデータを
2
次元または
3
次元に縮小すれば
可視化が可能となります。
この後、重要な次元削減アルゴリズムとして、主成分分析(「5.9 詳細:主成分分析」を参照)
と、等尺性マッピング(
Isomap
)や局所線形埋め込み(
Locally Linear Embedding
)などの多様体学習
(「5.10 詳細:多様体学習」を参照)を紹介します。
5.1.3
まとめ
ここでは、機械学習の基本的なアプローチを、簡単な例を通して見てみました。実践において重
要となる細かい部分は省略しましたが、機械学習がどのような問題を解決できるかについて、基本
的な考え方が理解できたかと思います。
簡単にまとめます。
教師あり学習
ラベル付き学習データに基づいてラベルを予測するモデル
分類
2
つ以上の離散カテゴリへの分類ラベルを予測するモデル
回帰
連続ラベルを予測するモデル
教師なし学習
ラベルのないデータの構造を識別するモデル
クラスタリング
データ内のグループを検出して識別するモデル
次元削減
より高次元データ内の低次元構造を検出し識別するモデル ...