3章時系列解析

SQL、データベース、分析のためのデータ準備の主な手順を説明したので、SQLで実行できる具体的な分析を行います。世界には一見限りないように思えるデータセットがあり、それに応じてデータセットを分析する方法が無限にあります。本章とこれ以降の章では、分析の種類をテーマ別に整理し、分析やSQLのスキルを磨くのに役立てたいと思います。取り上げるテクニックの多くは「2章 分析用のデータの前処理を行う」で示したものと、前の章に登場したものをベースにしています。さまざまな分析テーマがある中、非常に広く使われており重要な時系列データから始めます。

時系列解析は、SQLで実行する最も一般的な種類の分析の1つです。時系列は、時刻順に(多くの場合、一定間隔で)記録された一連の測定値やデータポイントです。日常生活には、毎日の最高気温、S&P 500株価指数、活動量計が記録した毎日の歩数など、多くの時系列データの例があります。時系列解析は、統計学やエンジニアリングから天気予報や事業計画まで、広範な業界や分野で使います。時系列解析は、時間とともに物事がどのように変化するかを把握して定量化する手段です。

予測は、時系列解析での一般的な目的です。時間は前にしか進まないので、未来の値は過去の値の関数として表せますが、逆はできません。ただし、過去が完全に未来を予測できるわけではないことに注意するのが重要です。広範囲な市況の変化、流行の変化、製品導入、またはその他の大きな変更が予測を困難にします。それでも、歴史的データを調べると知見につながることがあり、さまざまなもっともらしい結果を導き出すと計画に役立ちます。この原稿を書いている間に世界はCOVID-19の世界的なパンデミックの真っ只中にあります。このようなパンデミックは、最も長い歴史を持つ組織を除いて、100年来発生していません。したがって、現在の多くの組織はこの特定の出来事をかつて見たことがありませんでしたが、2001年のインターネットバブル崩壊と9/11攻撃、2007年から2008年の世界金融危機などの経済危機を乗り越えてきています。状況を注意深く分析して理解すると、有益な知見を導き出せることが多いのです。 ...

Get SQLではじめるデータ分析 ―クエリで行う前処理、時系列解析、コホート分析、テキスト分析、異常検知 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.