
1.4
教師なし学習を用いて機械学習システムを改良する
7
るデータだけでなく、訓練後に得られたデータからも迅速に隠れたパターンを見出すことができる。世
界に存在するラベルのない膨大なデータの宝箱を利用することができるのだ。
教師なし学習は、狭く定義された問題については教師あり学習に劣るが、強い
AI
型の限定された定
義のない問題に対する知識を汎化することに関しては、教師あり学習よりも優れている。
もう
1
つ重要な点がある。教師なし学習を用いると、データサイエンティストが機械学習システムを
構築する際によく直面する問題の多くを解決することができる。
1.4
教師なし学習を用いて機械学習システムを改良する
近年の機械学習の成功は、大量のデータが利用できるようになったこと、計算機ハードウェアとクラ
ウドの進歩、機械学習アルゴリズム上のブレークスルーによる。しかしこれらの成功のほとんどは、画
像クラス分類、コンピュータビジョン、音声認識、自然言語処理、機械翻訳などの狭義の
AI
問題に対
するものだ。
より野心的な
AI
問題を解くには、教師なし学習の真価を発揮させる必要がある。データサイエンティ
ストが機械学習システムを構築する際にしばしば直面する課題を、教師なし学習で解く方法を見てい
こう。
1.4.1
ラベル付きデータが十分にない
AI
を作ることは、ロケットを作ることに似ている。大きなエンジンとたくさんの燃料の両方
が必要だ。エンジンが大きくても燃料が足りなければ軌道に乗せられない。エンジンが小さ
くて燃料が多すぎれば離床