2章機械学習で何ができる?
機械学習を使うと何ができるのでしょうか。本章では機械学習でできることを、分類、回帰、クラスタリング、次元削減、その他に分けて解説します。その前に、まずはさまざまな機械学習に関するアルゴリズムをどう選ぶべきかについて見てみましょう。
2.1 どのアルゴリズムを選ぶべきか?
どのアルゴリズムを使えばいいのかを考えるには、それぞれのアルゴリズムの特徴を知っている必要があります。まずは、機械学習にどんな種類のものがあるか大まかに押さえておきましょう。
- 分類
正解となる離散的なカテゴリ(クラス)と入力データの組み合わせで学習し、未知のデータからクラスを予測する
- 回帰
正解となる数値と入力データの組み合わせで学習し、未知のデータから連続値を予測する
- クラスタリング
データを何かしらの基準でグルーピングする
- 次元削減
高次元のデータを可視化や計算量削減などのために低次元にマッピングする
- その他
推薦:ユーザーが好みそうなアイテムや、閲覧しているアイテムに類似しているアイテムを提示する
異常検知:不審なアクセスなど、普段とは違う挙動を検知する
頻出パターンマイニング:データ中に高頻度に出現するパターンを抽出する
強化学習:囲碁や将棋のような局所的には正解が不明確な環境で、取るべき行動の方針を学習する
これだけ色々あると、どれを選べばいいか悩むかもしれません。scikit-learnのチュートリアルに、便利なフローチャート1があるので、それをベースにしながらどのアルゴリズムを選べばいいか整理していきましょう(ただし、推薦、異常検知、頻出パターンマイニング、強化学習の場合は除きます)。図2.1に選択基準をまとめました。
Get 仕事ではじめる機械学習 第2版 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.