16章時系列パッケージ
ここ数年で、いくつものテック大企業が、自社の巨大な顧客基盤、洗練されたロギング、最先端のビジネスアナリティクス、多数の予測とデータ処理の需要があるデジタル組織として、収集してきた莫大な数の時系列の処理に関する多数のパッケージや論文を公開しました。本章では、拡大を続けるこのような時系列データセットに関係した研究開発の主要分野の一部、具体的には、予測と異常値検出について解説します。
16.1 大規模予測
多くのテック大企業にとって、時系列の取り扱いは、重要性が増している問題であり、これらの企業の組織内で自然に発生する問題でもあります。そのうちの数社が徐々に、「大規模予測」に的を絞った、自動化された賢い時系列パッケージを開発して、この問題に応えました。多岐にわたる領域であまりにも多くの予測が必要になったためです。Googleの自動化された予測パッケージを開発した2人のデータサイエンティストが、この商品の動機となった状況を2017年のブログ記事(https://www.unofficialgoogledatascience.com/2017/04/our-quest-for-robust-time-series.html)で次のように説明しています(強調表示は著者が加えています)。
Googleにおける時系列予測の需要は、最初の10年で会社の成長とともに急増しました。ビジネスやエンジニアリングの様々な必要性から、予測のアプローチが数多く生み出されましたが、そのほとんどがアナリストによる直接のサポートに依存するものでした。アプローチの量と種類の多さ、そして場合によっては整合性の欠如から、予測手法の統合や自動化や拡張、および結果を自社内に確実にデプロイできるツールを使った配布の試みが求められるようになっていったのです。つまり、Googleでの正確な大規模時系列予測を促進する手法とツールの開発の試みが求められたのです。 ...
Get 実践 時系列解析 ―統計と機械学習による予測 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.