
70 3 章 データマンジング
金融情報の統一
世界はお金によって回っている。多くのデータサイエンスプロジェクトが金融時系列データを中心として
回っているのはそのためだ。しかし、お金は汚れることがあるだけに、お金のデータにはクリーニングが必
要だ。
ここで問題になるのは、標準化された単位を使って国際価格を表現する通貨換算である。通貨の為替レー
トは
、同じ日の中でも数パーセントの変動があるので、場合によっては時間を意識した変換が必要になる。
また、為替レートは本当の意味で標準化されていない。市場ごとにそれぞれの為替レートがあり、スプレッ
ドと呼ばれる売値と買値の差額がある。スプレッドは為替交換手数料として機能している。
金融情報の統一では、インフレを考慮に入れることも大切だ。貨幣の時間価値とは、(一般に)今日のド
ルが 1 年後のドルよりも価値があるということである。将来のドルの価値を正しく計算するためには、イン
フレ率で割り引く必要がある。インフレ率は、バスケットと呼ばれる財の組合せの価格の変化から推計さ
れ、1 ドルの購買力を通時的に標準化するための手段となる。
一定の期間を対象とするモデルで調整されていない価格データを使うと、問題の原因になる。以前、私が
教えている学生のあるグループが、30 年分の株価と原油価格の間に強い相関関係が見られることに非常に
興奮し、コモディティ価格の予測モデルで株価を使いたいほどだった。しかし、どちらの価格もインフレ調
整をしていないドルによるものだったのである。インフレ調整をせずに ...