23章時系列
pandasは、もともと財務モデリング用に開発されたため、日付、時刻、および時間インデクスデータを扱うための機能を期待される通り豊富に用意しています。日付と時刻データは、異なるいくつかの種類が用意されているので、ここで説明します。
- タイムスタンプ(timestamp)
- ある特定の時刻(例えば、2021年7月4日7:00 a.m.)。
- 時間間隔(time interval)と期間(period)
- 特定の始点と終点の間の時間の長さ(例えば、2021年6月の1ヶ月)。期間は時間間隔の特殊な場合であり、通常、各時間間隔が一定で重複しない(例えば、1日を構成する24時間)。
- 時間差(time delta)と継続時間(duration)
- 精密な時間の長さ(例えば、22.56秒)。
この章では、pandasでこれらの日付や時刻のデータを処理する方法を紹介します。これはPythonやpandasで利用可能な時系列機能の完全なガイドではありません。ユーザが時系列をどのように扱うべきか、その指針を広く浅く示すことを目的としています。まず、Pythonで日付と時刻を扱うための機能について簡単に説明します。次に、pandasが提供する機能を詳しく説明します。最後にpandasで時系列データを扱う簡単な例を紹介します。
23.1 Pythonの日付と時刻
Pythonには、日付、時刻、時間差、期間に対して利用可能な表現が多数あります。pandasが提供する時系列関連の機能は、データサイエンスアプリケーションに対して非常に有用であるため、Pythonで使用される他のツールとの関係を理解することはとても有益です。
23.1.1 Python組み込みの日付と時刻:datetimeとdateutil ...
Get Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.