March 2019
Intermediate to advanced
424 pages
5h 18m
Japanese
本章では、教師あり学習を用いたデータ分類と回帰について説明します。本章を通じて、次のような事柄を学びます。
機械に人工知能を導入する最も一般的な手法のひとつが機械学習です。機械学習は、教師あり学習と教師なし学習の2つに大きく分けられます。ほかの分け方もありますが、あとで説明することにします。
教師あり学習(supervised learning)とは、ラベル付きの教師データを用いて学習モデルを構築する方法です。例として、年齢や学歴、住所などから、その人の所得を自動推定するシステムを開発することを考えます。そのためには、人々の詳細属性データを集めたデータベースを作り、それに所得データをラベル付けします。こうすることにより、どの属性がいくらの所得に対応するのかを、アルゴリズムに伝えることができます。この対応づけに基づいて、属性群からその人の所得を計算する方法を学習できるのです。
一方、教師なし学習(unsupervised learning)とは、ラベル付きのデータを用いずに学習モデルを構築する方法です。ある意味、前段落の話と真逆です。ラベルがないため、与えられたデータだけに基づいて潜在的な本質を抽出する必要があります。例えば、データの点群を複数のグループに分けるシステムを構築するとします。難しいのは、どのように分けるべきなのか、その基準が厳密にはわからない、ということです。したがって、教師なし学習のアルゴリズムは、与えられたデータセットを可能な限り最適な方法でグループ分けするしかありません。 ...
Read now
Unlock full access