第1章 リアルタイム分析 リアルタイム分析入門
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
データに何が起こっているかをリアルタイムで確認できることは、大きな競争上の利点だ。
ヒラリー・メイソン(ファスト・フォワード・ラボ創設者兼CEO
ビジネス環境における多くのデータは、時間の経過とともに徐々に到着するため、束縛されていないと考えられている。 顧客、プロデューサ、マシンは、昨日も今日もデータを作成し、明日もさらにデータを作成し続ける。 このプロセスは、あなたが廃業しない限り終わることがないため、データセットが意味のある意味で完全になることはない。
注
Confluentの「Business Impact of Data Streaming」に参加した企業のうち、97%がリアルタイムデータストリームにアクセスしており、66%が広くアクセスしている:State of Data in Motion Report 2022」に参加した企業のうち、97%はリアルタイムのデータストリームにアクセスしており、66%は広範囲にアクセスしている。
今日、多くの企業がストリーミング・データとリアルタイム・アナリティクスを採用し、より迅速で、信頼性が高く、正確な意思決定を行うことで、市場セグメントにおける競争優位性を獲得している。
この章では、ストリーミングとリアルタイムアナリティクスの入門を提供する。 ストリーミングデータについて再確認することから始め、なぜ組織がそのデータの上にアナリティクスを適用したいのかを説明する。 いくつかのユースケースを紹介した後、構築可能なリアルタイムアナリティクスアプリケーションのタイプの概要で締めくくる。
イベントストリームとは何か?
ストリーミングという用語は、 、継続的で終わることのないデータの流れを表している。データは時間と共にインクリメントで利用可能になるため、データセット全体が利用可能になるのを待つ必要がなく、ダウンロードすることなく利用することができる。
データストリームは、図1-1に示すように、時系列に並べられた の一連のデータ点から構成される。
図1-1. データ・ストリーム
各データ点は、イベント、またはビジネスの状態における変化()を表している。例えば、組織から送られてくるトランザクションのストリームや、モノのインターネット(IoT)センサーが読み取り値を発するようなリアルタイムのイベントである。
イベント・ストリームに共通するのは、ビジネスが存在する限り、データを生成し続けるということである。 イベント・ストリームは、ビジネス内のさまざまなデータ・ソースから、さまざまな形式とボリュームで生成される。
また、データストリームとは、不変性で、時間順に並んだイベントの流れであり、ビジネスで発生した状態変化に関する事実を伝えるものと考えることもできる。 これらのソースには、eコマースの購入、ゲーム内のプレーヤーの活動、ソーシャルネットワークからの情報、クリックストリームデータ、ウェブサーバからの活動ログ、センサーデータ、データセンター内の接続デバイスや計測器からの遠隔測定などが含まれるが、これらに限定されるものではない。 ...