
4 1 章 データサイエンスとは
ど、重要な知見を提供できる強力なツールを構築できるようになっていくと私は考えている。本書の主要目
標の 1 つは、
ビッグデータサイエンティストと同じように考えるための知のツールをビッグデータ技術者に
も提供することである。
1.2 データについての興味深い問い
優れたデータサイエンティストは、もともと自分の周囲の世界、特に仕事と関連のあるドメイン(専門分
野)や応用に対して好奇心を持っているものだ。彼らは自分が分析しているデータの持ち主と好んで話を
し、質問をぶつけていく。この分野について学んだことで最も面白いのはどのようなことか、なぜそれに興
味を持ったのか、自分のデータセットを分析して何を学びたいと思っているのか、といったことだ。優れた
データサイエンティストは、絶えず質問し続ける。
そして優れたデータサイエンティストは、幅広い関心を持っている。刺激的で面白いものごとに対して広
い視野を得るために毎日新聞を読む。世界がとても面白いことを知っている。あらゆることについて幅広く
知識を持ち、他の人の専門分野に入る準備を怠らない。自分が安心していられる場所から少し外に出てみる
勇気を持っており、外に出たときにはさらに多くのことを学ぼうという意欲を持っている。
ソフトウェア開発者は、あまり質問しないようにと言われるが、データサイエンティストは大いに質問す
るようにと言われる。そして、我々は実際、次のような質問をする。
• このデータセットから何が学べるか?
• あなたやあなたと同じ分野の人が本当に知りたいことは何か? ...