
16 1 章 データサイエンスとは
両者の違いを理解するためには、おそらくさまざまなデータサイエンス問題の特徴を調べて、それらに回
帰または分類かのラベルを与える(分類する)のが最も良い方法だろう。分類と回帰の問題を解くために使
われるアルゴリズムは異なる。ただし、同じ問題に両方の方法でアプローチできることも少なくない。
• 特定の銘柄の株価が明日上がるか下がるか? (分類)
• 特定の銘柄の株価が明日いくらになるか?
(回帰)
• この人物を生命保険に加入させるとリスクになるかどうか? (分類)
• この人物は何歳まで生きることになるか? (回帰)
本書で、そして人生で遭遇する問題が分類問題か回帰問題かにはいつも注意を怠らないようにしよう。
1.5 データサイエンスの動画:Quant Shop
基本原則を自分のものにするためには、実際に手を動かす経験が必要だと私は考えている。そこで、私が
データサイエンスを教える際は、面白いけれども複雑な予測問題を学生チームに出題し、予測モデルを構
築、評価させるようにしている。
この課題では、必ず学生たちに検証可能な予測を、発表イベントで披露することを義務付けている。学生
たちはゼロから始めなければならない。関連するデータセットを見つけ、独自の評価システムを構築し、モ
デルを考案するのである。そして最後に発表イベントに参加して、自分たちの予測の成否を確認しなければ
ならない。
2014 年の秋学期には、1 つの実験として、各チームのプロジェクトの進捗をビデオに記録してみた。この ...