3章金融データの処理

データがアルゴリズムに勝ることは明らかです。包括的なデータがなければ、包括的ではない予測をしがちです。

—ロブ・トーマス(2016)

アルゴリズムトレードでは、表3-1に示すように、一般に4種類のデータを扱う必要があります。これは金融データの世界を単純化したものですが、データをヒストリカルなもの、リアルタイムなもの構造化されたもの、構造化されていないものに分けて考えることは、技術設定においても有用です。

表3-1 金融データの種類(例)

 構造化データ非構造化データ
ヒストリカルデータEOD(End Of Day)終値金融のニュース記事
リアルタイムデータFXのbid/ask価格Twitterへの投稿

本書では、ヒストリカルとリアルタイムの構造化データ(数値、表形式のデータ)を主に扱っています。本章では特に、フランクフルト証券取引所で取引されているSAP社の株式のEOD終値のような、ヒストリカルの構造化データに焦点を当てています。しかし、このカテゴリーには、NASDAQで取引されているApple社の株式の1分足データのような日中のデータも含まれます。リアルタイムの構造化データの処理については、「7章 リアルタイムデータとソケットを扱う」で説明しています。

アルゴリズムトレードのプロジェクトは、通常、金融のヒストリカルデータに基づいて(バック)テストする必要のあるトレードのアイディアや仮説を考えることから始まります。これが本章の背景であり、その計画は以下の通りです。「3.1 異なるデータソースから金融データを読み取る」では、pandasを使って、さまざまなファイルやウェブベースのソースからデータを読み込みます。「3.2 オープンデータソースの使用」 ...

Get Pythonからはじめるアルゴリズムトレード ―自動売買の基礎と機械学習の本格導入に向けたPythonプログラミング now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.