November 2021
Beginner to intermediate
312 pages
4h 3m
Japanese
これまでに、機械学習の基礎と、素晴らしいオープンソースのPythonパッケージを使ったさまざまなシステムの構築方法を学んだ。そして、機械学習モデルを迂回する方法にも触れた。
最終章では、よりよいモデルを構築するためのヒントを紹介する。
本書のレビューを行っているときに、とあるレビュアーから「この課題の解決に、この機械学習アルゴリズムを選択した根拠なり理由が知りたい」という質問をいただいた。曰く、「複数のアルゴリズムの中でどれを選べばよいのかというのは結構重要なところだと思っていて、なぜここではたとえばSVMを使わないのか、逆にマルウェアの検知のためにAPI呼び出しを使った特徴量に対して勾配ブースティング等を使わないのか理由があるならぜひとも知りたい。結局機械学習って、どのアルゴリズムを選ぶかが一番悩むところじゃないかと・・。もしくは、全部試してみてTPなりFNなりを比較するしかないなら、その一言だけでもあると嬉しい。」ということであった。
素朴な質問ではあるが、確かにこうした類似の質問への回答はあまりなされていないように思われるし、機械学習の初学者が最初に思い浮かべる疑問としてもっともなものだと考えられる。このため、ここでこの質問に対する回答をしていきたい。
広範な範囲でのコンセンサスはとれてはいないと思うが、機械学習アルゴリズムを用いる問題解決の過程においては、データセットの内容によって次のような選択がなされていると思われる。
これは表10-1のようなアルゴリズムごとの得手・不得手、向き・不向きがあるために選択される結果と考えられる。 ...
Read now
Unlock full access