321
11 章
機械学習
カンニングも高度になると学習と区別がつかなくなる。
— ジャン・シャウマン
私の研究人生において、機械学習の重要性に懐疑的だった時期が長かった。壮大ではあるが、非常に乏し
い結果でしかないことを、長年にわたり聞いていた。しかし、潮目が変わったことは明らかだ。強力な新ア
ルゴリズムでも、魅力的な新しい応用方法でも、今日の計算機科学で最も面白い業績は、機械学習に関する
ものである。
このような革命が起こった理由はいくつかある。まず、扱うことのできるデータの量とコンピュータの計
算能力が、超えられないとされていたしきい値を超えて、機械学習を使って(たとえそれが古いアプローチ
であ
っても)面白いことをできるようになった。それにより、拡張可能性が高い手法の開発に拍車がかか
り、データリソースとシステム開発に対する投資が活発化した。オープンソースソフトウェアの文化によ
り、新しいアイデアが実用ツールになるまでの速度が上がったことも大きい。今日の機械学習は爆発的に成
長しており、面白いことがたくさん起こっている。
本書では、今までデータに基づいてモデルを構築する方法として、線形回帰と最近傍法の 2 つをかなり詳
しく説明した。多くの応用では、この 2 つを知っていれば十分である。ラベル付きの訓練データが十分にあ
れば、どんな方法でも良い結果を出せるだろう。しかし、そのようなデータがなければ、どんな方法を使っ
てもうまくいかない。最良の機械学習アルゴリズムなら違いを生み出せるが、一般にそれはごくわずかなも
のである。本書の目的は、読者をハイハイの状態から歩けるところまで導くことだ。歩けるようになれば、
もっと専門的な本で、今度は走り方を学ぶことができる。
現在、興味深く重要な機械学習アルゴリズムがいくつも考案されている。この章では、それらの手法を取 ...