3章金融データの処理
データがアルゴリズムに勝ることは明らかです。包括的なデータがなければ、包括的ではない予測をしがちです。
—ロブ・トーマス(2016)
アルゴリズムトレードでは、表3-1に示すように、一般に4種類のデータを扱う必要があります。これは金融データの世界を単純化したものですが、データをヒストリカルなもの、リアルタイムなもの、構造化されたもの、構造化されていないものに分けて考えることは、技術設定においても有用です。
構造化データ | 非構造化データ | |
---|---|---|
ヒストリカルデータ | EOD(End Of Day)終値 | 金融のニュース記事 |
リアルタイムデータ | FXのbid/ask価格 | Twitterへの投稿 |
本書では、ヒストリカルとリアルタイムの構造化データ(数値、表形式のデータ)を主に扱っています。本章では特に、フランクフルト証券取引所で取引されているSAP社の株式のEOD終値のような、ヒストリカルの構造化データに焦点を当てています。しかし、このカテゴリーには、NASDAQで取引されているApple社の株式の1分足データのような日中のデータも含まれます。リアルタイムの構造化データの処理については、「7章 リアルタイムデータとソケットを扱う」で説明しています。
アルゴリズムトレードのプロジェクトは、通常、金融のヒストリカルデータに基づいて(バック)テストする必要のあるトレードのアイディアや仮説を考えることから始まります。これが本章の背景であり、その計画は以下の通りです。「3.1 異なるデータソースから金融データを読み取る」では、pandasを使って、さまざまなファイルやウェブベースのソースからデータを読み込みます。「3.2 オープンデータソースの使用」 ...
Get Pythonからはじめるアルゴリズムトレード ―自動売買の基礎と機械学習の本格導入に向けたPythonプログラミング now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.