October 2025
Intermediate to advanced
328 pages
3h 56m
Japanese
時系列とは、時間とともに変化するシステムから得られる測定値のシーケンスです。11章で使った回帰のようなツールの多くは、時系列でも使えます。しかし、この種のデータに特に有用な別な分析手法もあります。
例として、2001年から2024年までの米国の再生可能エネルギー発電量データと、同じ期間の気象データという2つのデータセットを取り上げます。時系列を長期トレンドと繰り返される季節変動成分に分解する手法を行い、線形回帰モデルを用いて、トレンドの推定と予測を行います。また、時系列データを分析するために広く使われているモデルである「自己回帰和分移動平均(ARIMA:autoregressive integrated moving average)」モデルを実際に試します。
時系列データの例として、米国エネルギー情報局(US Energy Information Administration)のデータセットを使用します。このデータセットには、2001年から2024年までの再生可能エネルギーによる月別総発電量が含まれています。データのダウンロード方法はこの章のノートブックで説明しています。
データを読み込んだ後、それを作業しやすい形式に変換する必要があります。
elec = (pd.read_csv("Net_generation_for_all_sectors.csv", skiprows=4).drop(columns=["units", "source key"]).set_index("description").replace("--", np.nan).transpose().astype(float))
再フォーマットされたデータセットでは、各行が各月次を表し、各列は供給源別のギガワット時(GWh)単位の月次総量のシーケンスです。以下は列のラベルで、異なる電力の供給源「セクター」を示しています。 ...
Read now
Unlock full access