まえがき

レイチェル・シャット(Rachel Schutt)

データサイエンスは、産業界において新たに出現した分野であり、まだ学術的なテーマほどは明確に定義されていません。この本は、「データサイエンスとは何か」という現在進行中の調査内容を説明するものです。その内容は、「データサイエンス入門(Introduction to Data Science)」という講義に基づいています。この講義は、私が計画して、コロンビア大学で2012年の秋に初めて教えたものです。

この本と、それが生まれた背景を知るために、私についてのある程度の情報と、私がこの講義をなぜ始めたのかについてのモチベーションを説明しておくとわかりやすいかもしれません。

モチベーション

手短に言うと、この講義は、私が大学生の頃に受講したかったコースを実現したものです。しかし、当時は1990年代で、現在のようなデータ爆発の真っ最中のような時代ではありません。したがって、当時には存在するはずのなかった講義です。当時、私は数学を専攻している学部生で、理論や証明系の内容を研究していました。私はこの進路を選んだことに満足していましたし、それによって、私は厳密な問題解決をするための訓練を行えたと思っています。しかし、もう少し現実世界の問題を解決するために使えるスキルにも触れることができたらよかったのに、とも思っています。

学部生の頃や統計学を専攻した博士課程の頃は、私は、自分の行くべき分野と場所を求めて、放浪の旅をしていました。私は、パターンを見つけることや、難問を解決して活用することを愛していたので、その愛を注ぐ場所を求めていたのです。私がこの話をするのは、生徒たちは「人生において何に関与するのか」を、いま考えるべきだと思うからです。私が学生のころは、データサイエンスの分野で働くことを計画するなどはできませんでしたし、そのころは、まだ分野としても存在していませんでした。私から生徒たち(あるいは、この話に興味ある人)へのアドバイスとして言えるのは、すべてをいま完全に理解できる必要はない、ということです。放浪の旅を選んでもいいのです。あなたが何にたどり着くかは、きっと誰にもわかりません。私は博士号取得後、Googleで数年働きましたが、ちょうどその頃、「データサイエンス」や「データサイエンティスト」という単語が、シリコンバレーで使われるようになりました。 ...

Get データサイエンス講義 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.