付録A演習問題の解答

[注記]

コードを書く演習問題の解答は、https://github.com/ageron/handson-ml2のJupyterノートブックに掲載されている。

A.1 1章:機械学習の現状

  1. 機械学習とは、データから学習できるシステムを作ることである。学習とは、何らかの測定手段に基づき、あるタスクを処理した成績が上がるという意味である。
  2. 次の通り。 
    • アルゴリズムを使ったソリューションがない複雑な問題の解決。
    • 思いつきの規則が延々と続くものに代わるモジュールの開発。
    • 変動する環境に合わせて自分を修正できるシステムの開発。
    • 人間の学習の支援(たとえばデータマイニング)。
  3. 個々のインスタンスに問題の答えが含まれている訓練セット(これをラベルと呼ぶ)。
  4. 回帰と分類。
  5. クラスタリング、可視化、次元削減、相関ルール学習、異常検知、新規検知。
  6. 強化学習。未知の領域で歩き方を探索して学習できるようにしたければ、それは強化学習が解決を目指すタイプの問題の典型例である。教師あり学習、教師なし学習の問題として、この問題を表現することもできるが、強化学習よりも不自然になる。
  7. 集団の定義がわからない場合は、クラスタリングアルゴリズム(教師なし学習)を使って似ている顧客のクラスタに顧客を分割する。しかし、集団への分類方法がわかっている場合には、各集団のデータ例を多数与えて訓練した分類アルゴリズム(教師あり学習)を使えば、すべての顧客をその集団に分類できる。
  8. 典型的な教師あり学習問題である。ラベル(スパムかハムか)を付けたメールの例を多数与えてアルゴリズム訓練すればよい。 ...

Get scikit-learn、Keras、TensorFlowによる実践機械学習 第2版 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.