1章はじめに:データサイエンスとは

この数年間、メディアでは「データサイエンス」や「ビッグデータ」が大々的に取り上げられています。これに対して、最初は疑いを持ったり困惑したりするのが普通だと思います。実際、私たちキャシーとレイチェルもまさにそのような反応でした。

私たちは最初はそれぞれがそのように困惑して過ごしていて、そして、出会った後は毎週水曜日の朝食のたびごとに2人で困惑するようになりました。しかし、そういった困惑の中でも最後までぬぐいきれなかった感覚がありました。それは、その困惑の中には何らかの現実があり、おそらくそれは広く深いものであり、データにまつわる文化にパラダイムシフトを起こすものなのではないか、という感覚です。そのパラダイムシフトは、もしかしたら私たちの力となってくれるものなのではないか、とさえ考えるようになりました。そこで、私たちはそれを無視するのではなく、さらに探ることにしました。

しかし、そこに踏み込む前に、まずその困惑と曖昧さを引き起こしたのは何なのかを掘り下げて考えてみましょう。そうしたいのは、おそらくみなさんも同じなのではないでしょうか。その後、どのようにして過去の懸念を克服し、最終的にはレイチェルがどのようにコロンビア大学でデータサイエンスの講座を作り上げ、そしてキャシーがその講座をブログで取り上げるに至ったかを説明します。みなさんはその講座に基づいた書籍を現在読んでいるのです。

1.1 ビッグデータとデータサイエンスの過剰喧伝

既におそらく多くの人が、さまざまな理由からデータサイエンスに対して懐疑的になってしまっているのではないかと思います。そのため、まずは何に懐疑的になっているのか、そしてなぜ懐疑的になるかについて整理してみましょう。この点をあらかじめ整理することで、筆者らも読者のみなさんと同じことを感じている、ということを知らせたいのです。読者のみなさんがデータサイエンスに対して懐疑的であることは、データサイエンスを社会にプラスの影響を与える分野へと昇華させる影響力を、みなさん自身が保有していることになるのです。 ...

Get データサイエンス講義 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.