
3.1 データサイエンスで使われるプログラミング言語 55
私は Mathematica には愛着がある
*
1。ちょっとした
データ分析やシミュレーションを行いたいときに
は、よく Mathematica を使う。Mathematica は価格が高いため、使用できるユーザは限られていた
が、Wolfram 言語のリリースにより、従来よりも広い範囲のコミュニティに門戸が開かれることにな
るだろう。
• Excel:Excel をはじめとするスプレッドシートソフトは、データセットに何が含まれているかを確か
める探索的データ分析において威力を発揮する。スプレッドシートソフトはすばらしい機能を備えて
いる。
本格的なスプレッドシートソフトには、一般にはあまり知られていない、パワーユーザ向けの機能を
驚くほど豊富に備えている。私が昔教えた学生で、現在は Microsoft の役員にまで出世した人物から
聞いた話だが、Excel の新機能リクエスト全体の 25 % は、既に存在する機能だという。あればいい
なと思う Python ライブラリはきちんと探せばたいてい見つかるのと同じように、Excel に追加して
ほしいと思うデータ操作機能や特殊関数もきちんと探せば見つかるはずだ。
3.1.1 ノートブック環境の重要性
データサイエンスプロジェクトの主な成果物は、プログラムではない。データセットでも、データに対し
てプログラムを実行した結果でも、執筆されたレポートでもない。
すべてのデータサイエンスプロジェクトは、成果物として、コード、データ、計算結果、プロセスから得 ...