book

リアルタイム分析システムの構築

by Mark Needham

March 2025

Beginner to intermediate

220 pages

3h 15m

Japanese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

本書で使用されている慣例コード例を使うオライリー・オンライン・ラーニング問い合わせ先謝辞
イベントストリームとは何か？ストリーミング・データを理解するリアルタイム分析とは何か？リアルタイム分析の利点新たな収入源洞察へのタイムリーなアクセスインフラコストの削減総合的なカスタマー・エクスペリエンスの向上リアルタイム分析の使用例ユーザ向けアナリティクスパーソナライゼーションメトリック異常検出と根本原因分析視覚化アドホック分析ログ分析/テキスト検索リアルタイム分析アプリケーションを分類する内向きと外向きマシンと人間の対決概要
リアルタイム分析エコシステムの定義クラシック・ストリーミング・スタック複雑なイベント処理ビッグデータ時代現代のストリーミング・スタックイベントプロデューサーストリーミング・データ・プラットフォームストリーム処理レイヤーサービング・レイヤーフロントエンド概要
既存のアーキテクチャセットアップMySQLApache KafkaZooKeeper注文サービスコンポーネントをスピンアップするデータを検査するリアルタイム分析の応用概要
Kafkaストリームとは何か？Quarkusとは何か？QuarkusアプリケーションQuarkus CLIのインストールQuarkusアプリケーションの作成トポロジーの作成キーバリューストアをクエリするHTTPエンドポイントの作成アプリケーションを実行するHTTPエンドポイントをクエリするKafkaストリームの限界概要
なぜ他のストリームプロセッサーを使えないのか？なぜデータウェアハウスは使えないのか？アパッチ・ピノとは何か？ピノはどのようにデータをモデル化し、ストアしているのか？スキーマテーブルセットアップデータの取り込みピノ・データ・エクスプローラーインデックスウェブアプリを更新する概要
ダッシュボードアーキテクチャストリームリットとは何か？セットアップダッシュボードを構築する概要
演算子データベースからの変更点の取得変更データの取得なぜCDCが必要なのか？CDCとは何か？CDCを実装するための戦略とは何か？ログベースのデータ収集CDCシステムの要件デベシウムCDCをAATDに適用するセットアップMySQLにDebeziumを接続する製品ストリームをクエリする製品を更新する概要
Kafkaストリームで注文を充実させるピノにオーダー項目を追加する受注サービスを更新するStreamlitダッシュボードをリフレッシュする概要

注文状況エンリッチド・オーダー・ストリームアパッチ・ピノのアップサート受注サービスを更新するUsersResourceの作成allUsersエンドポイントを追加するユーザ・エンドポイントの注文を追加する個別注文のエンドポイントを追加するクロスオリジンリソース共有を設定するフロントエンドアプリダッシュボードでの注文状況各注文ステータスに費やした時間注文が滞っている可能性がある概要
配送状況アパッチ・ピノをアップデートする受注状況配送状況受注サービスを更新する個別注文地域別受注遅延新しいAPIエンドポイントを消費する概要
プリプロダクションキャパシティ・プランニングデータのパーティション分割スループットデータ保持データの粒度合計データサイズ複製因子デプロイプラットフォーム社内スキルデータのプライバシーとセキュリティコストコントロールポストプロダクションモニタリングとアラートデータガバナンス概要
コンテンツ・レコメンデーション（プロフェッショナル・ソーシャルネットワーク）問題点解決策利点オペレーショナル・アナリティクス（ストリーミング・サービス）問題点解決策利点リアルタイム広告分析（オンライン・マーケットプレイス）問題点解決策利点ユーザ向けアナリティクス（コラボレーションプラットフォーム）問題点解決策利点概要
エッジ分析コンピューティングとストレージの分離データレイクハウスリアルタイムデータ可視化ストリーミング・データベースサービスとしてのストリーミング・データ・プラットフォーム逆ETL概要

Content preview from リアルタイム分析システムの構築

序文

私がソフトウェア・エンジニアリングのキャリアをスタートさせた2000年代初頭、ソフトウェア・システムを設計する際、データ分析は後回しにされることが多かった。1日に1回実行されるバッチジョブは、運用データベースからデータを抽出し、データウェアハウスにロードする。ビジネスアナリストは通常、昨日や先週のデータを見ることができれば満足し、レポートを作成したり、1回限りのクエリを実行したりしていた。

演算子データベース内で実行される、高度に最適化された手作業のクエリを除けば、ユーザー向けのアナリティクスというアイデアはほとんどなかった。それ以来、リアルタイム・アナリティクスに対する要求は大幅に高まっている。不正検知、リソース計画、コンテンツ推薦、予測分析、その他多くのユースケースは、価値を提供するために最新のデータを必要とする。インスタンスンス、あなたのクレジットカードが盗まれ、銀行が不正使用のパターンを検出した場合、あなたは明日ではなく今すぐカードをブロックしてほしいと思うだろう？

Apache Kafka（データストリーミング）、Apache Flink（ストリーム処理）、Apache Pinot（データ分析）、Apache Superset（データ可視化）などのツールやプラットフォームは、リアルタイム分析の優れた基盤を提供し、ここ数年で急速に普及している。同時に、最初のユースケースの実装を始めることは困難であり、次のような疑問を持つかもしれない：どの目的でどのツールを選ぶべきか？首尾一貫したソリューションを実現するために、個々のピースをどのように組み合わせるか？本番稼動にはどのような課題があり、それをどのように克服するのか？

マーク氏の著書は、これらやその他多くの懸念事項に関するガイダンスの宝庫である。リアルタイム・アナリティクスとは何なのか）という基礎から始まり、この分野のソフトウェア・エコシステムの包括的な概要を提供し、主要なリアルタイム・アナリティクス・プラットフォームの1つであるApache Pinotについて論じ、生産上の注意点だけでなく、地理空間クエリやアップサート演算（ほとんどのアナリティクス・ストアでは悪名高い厄介な部分）など、より具体的な側面にも踏み込んでいる。

変更データキャプチャ（CDC）のオープンソースプラットフォームであるDebeziumに長年携わってきた私にとって、このトピックに関する章全体が掲載されたことは特に喜ばしいことだ。MySQLやPostgreSQLのような演算子データベースからApache Pinotのような分析プラットフォームへ有効期間中のデータ変更を供給することは、Debeziumコミュニティで何度も目にした重要なユースケースである。マーク自身が経験豊富なCDCユーザであるため、CDCの主要なユースケースと実装アプローチを説明し、包括的な例でDebeziumのセットアップ方法を示すという素晴らしい仕事をしている。

細部へのこだわりと実践的なハンズオンスタイルは、この本全体の定義テーマである。概念的には、どのような議論にも必ず実践例が続き、読者にさまざまなアイデアや技術をどのように実行に移すかを詳細に示している。本書は端から端まで読むのに適しているが、特定のトピックについてもっと学びたい場合は、特定の章だけを選ぶこともできる。

私たちを取り巻く世界はリアルタイムであり、私たちが構築するソフトウェア・システムはその事実を考慮する必要がある。データをリアルタイムで把握するためのアナリティクスのユースケースを実装しているあなたにとって、『 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341626881Supplemental Content

リアルタイム分析システムの構築

by Mark Needham

序文

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

コードとしてのポリシー

経理における人工知能

ハイパフォーマンスMySQL 第4版

インタフェースの設計第3版

Publisher Resources

序文

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

コードとしてのポリシー

経理における人工知能

ハイパフォーマンスMySQL 第4版

インタフェースの設計 第3版

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

インタフェースの設計第3版