book

リアルタイム分析システムの構築

by Mark Needham

March 2025

Beginner to intermediate

220 pages

3h 15m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
イベントストリームとは何か？ストリーミング・データを理解するリアルタイム分析とは何か？リアルタイム分析の利点新たな収入源洞察へのタイムリーなアクセスインフラコストの削減総合的なカスタマー・エクスペリエンスの向上リアルタイム分析の使用例ユーザ向けアナリティクスパーソナライゼーションメトリック異常検出と根本原因分析視覚化アドホック分析ログ分析/テキスト検索リアルタイム分析アプリケーションを分類する内向きと外向きマシンと人間の対決概要
リアルタイム分析エコシステムの定義クラシック・ストリーミング・スタック複雑なイベント処理ビッグデータ時代現代のストリーミング・スタックイベントプロデューサーストリーミング・データ・プラットフォームストリーム処理レイヤーサービング・レイヤーフロントエンド概要
既存のアーキテクチャセットアップMySQLApache KafkaZooKeeper注文サービスコンポーネントをスピンアップするデータを検査するリアルタイム分析の応用概要
Kafkaストリームとは何か？Quarkusとは何か？QuarkusアプリケーションQuarkus CLIのインストールQuarkusアプリケーションの作成トポロジーの作成キーバリューストアをクエリするHTTPエンドポイントの作成アプリケーションを実行するHTTPエンドポイントをクエリするKafkaストリームの限界概要
なぜ他のストリームプロセッサーを使えないのか？なぜデータウェアハウスは使えないのか？アパッチ・ピノとは何か？ピノはどのようにデータをモデル化し、ストアしているのか？スキーマテーブルセットアップデータの取り込みピノ・データ・エクスプローラーインデックスウェブアプリを更新する概要
ダッシュボードアーキテクチャストリームリットとは何か？セットアップダッシュボードを構築する概要
演算子データベースからの変更点の取得変更データの取得なぜCDCが必要なのか？CDCとは何か？CDCを実装するための戦略とは何か？ログベースのデータ収集CDCシステムの要件デベシウムCDCをAATDに適用するセットアップMySQLにDebeziumを接続する製品ストリームをクエリする製品を更新する概要
Kafkaストリームで注文を充実させるピノにオーダー項目を追加する受注サービスを更新するStreamlitダッシュボードをリフレッシュする概要

注文状況エンリッチド・オーダー・ストリームアパッチ・ピノのアップサート受注サービスを更新するUsersResourceの作成allUsersエンドポイントを追加するユーザ・エンドポイントの注文を追加する個別注文のエンドポイントを追加するクロスオリジンリソース共有を設定するフロントエンドアプリダッシュボードでの注文状況各注文ステータスに費やした時間注文が滞っている可能性がある概要
配送状況アパッチ・ピノをアップデートする受注状況配送状況受注サービスを更新する個別注文地域別受注遅延新しいAPIエンドポイントを消費する概要
プリプロダクションキャパシティ・プランニングデータのパーティション分割スループットデータ保持データの粒度合計データサイズ複製因子デプロイプラットフォーム社内スキルデータのプライバシーとセキュリティコストコントロールポストプロダクションモニタリングとアラートデータガバナンス概要
コンテンツ・レコメンデーション（プロフェッショナル・ソーシャルネットワーク）問題点解決策利点オペレーショナル・アナリティクス（ストリーミング・サービス）問題点解決策利点リアルタイム広告分析（オンライン・マーケットプレイス）問題点解決策利点ユーザ向けアナリティクス（コラボレーションプラットフォーム）問題点解決策利点概要
エッジ分析コンピューティングとストレージの分離データレイクハウスリアルタイムデータ可視化ストリーミング・データベースサービスとしてのストリーミング・データ・プラットフォーム逆ETL概要

Content preview from リアルタイム分析システムの構築

第4章. KafkaストリームでKafkaをクエリする

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている：translation-feedback@oreilly.com

AATDは現在、注文数や売上高をリアルタイムで把握できていない。同社は、注文数の急増や減少を把握することで、演算子により迅速に対応できるようにしたいと考えている。

AATDのエンジニアリング・チームは、既に他のアプリケーションでKafka Streamsに慣れているので、最近の注文と収益を表示するHTTPエンドポイントを公開するKafka Streamsアプリを作成する。 Quarkusフレームワークを使ってこのアプリを作成し、まずは素朴なバージョンから始める。その後、いくつかの最適化を適用する。最後に、ストリーム・プロセッサを使用してストリーミング・データをクエリすることの限界について要約する。図 4-1に、この章で構築するものを示す。

Kafkaストリームとは何か？

Kafka Streamsは、入力Kafkaトピックを出力Kafkaトピックに変換するストリーミング・アプリケーションを構築するためのライブラリである。第2章で説明したリアルタイム分析スタックのストリーム・プロセッサ・コンポーネントの一例である。

Kafka Streamsは、ストリームの結合、フィルタリング、変換によく使われるが、この章では既存のストリームをクエリするために使う。

Kafka Streams アプリケーションの中心は、アプリケーションのストリーム処理ロジックを定義するトポロジーである。トポロジーは、データが入力ストリーム（ソース）からどのように消費され、出力ストリーム（シンク）にプロデューサを生成できるように変換されるかを記述する。

具体的には、『The Internals of Kafka Streams』の著者であるJacek Laskowski氏は、トポロジーを以下のように定義している：

Kafka Streamsアプリケーションのストリーム処理ロジックを表す、ストリーム処理ノードの有向非循環グラフ。

このグラフでは、ノードは処理作業であり、関係はストリームである。このトポロジーを通じて、最も複雑なデータ処理タスクも処理できる強力なストリーミング・アプリケーションを作成することができる。図4-2にトポロジーの例を示す。

Kafka Streamsはドメイン固有言語（DSL）を提供し、これらのトポロジーの構築を簡素化する。

このセクションで使用するKafka Streamsの抽象化の定義を説明しよう。以下の定義は公式ドキュメントから引用している：

Kストリーム: KStreamは、レコードストリームの抽象化であり、各データレコードは、束縛されていないデータセット内の自己完結したデータを表す。 KStream内のデータレコードは「INSERT」操作として解釈され、各レコードは、追記のみの元帳に新しいエントリを追加する。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341626881Supplemental Content

リアルタイム分析システムの構築

by Mark Needham

第4章. KafkaストリームでKafkaをクエリする

図4-1. Kafkaストリームのアーキテクチャ

Kafkaストリームとは何か？

図4-2. Kafkaストリームのトポロジー

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

コードとしてのポリシー

経理における人工知能

ハイパフォーマンスMySQL 第4版

インタフェースの設計第3版

Publisher Resources

第4章. KafkaストリームでKafkaをクエリする

図4-1. Kafkaストリームのアーキテクチャ

Kafkaストリームとは何か？

図4-2. Kafkaストリームのトポロジー

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

コードとしてのポリシー

経理における人工知能

ハイパフォーマンスMySQL 第4版

インタフェースの設計 第3版

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

インタフェースの設計第3版