5章クラウドデータレイクアーキテクチャのパフォーマンスの最適化
単純は究極の洗練である。
—— レオナルド・ダ・ヴィンチ
もっともシンプルにパフォーマンスを定義するならば、それは「仕事をタイムリーに完了させる能力」です。しかし、クラウドサービスの分野では「パフォーマンス」という言葉は多様な意味を持ち、それはパフォーマンスを測る尺度が1つではないためです。この章では、パフォーマンスの階層構造を掘り下げ、クラウドデータレイクにおけるパフォーマンスが何を意味するのか、そのさまざまな側面を探ります。また、クラウドデータレイクを最適化し、チューニングすることでパフォーマンスを最大限に高めるための戦略についても深く理解を深めていきます。
5.1 パフォーマンス計測の基礎
パフォーマンスという言葉を使うとき、多くの人はフィニッシュラインを越えて世界記録を樹立するランナーのような状況を想像するかもしれません。しかし、一般的な目標は、タスクを成功させて完了すること、そして観客の期待に応え、時にはそれを超える成果を達成することです。クラウドデータレイクの文脈では、パフォーマンスは設定された目標に基づいてタスクを遂行し、それを達成する能力を指します。
タスクのパフォーマンスには2つの側面があり、パフォーマンスの計測方法はこれら2つの要素を組み込んだものでなければなりません。
- レスポンスタイム
- タスクの完了までにどれだけの時間がかかったか
- スループット
- どれだけの量の出力が得られたか
「4.1.2 日常生活におけるスケーラビリティ」で使ったサンドイッチ作りの例をもう1度使いましょう。あのときは、図5-1のような一貫生産(エンドツーエンド)方式と図5-2のような生産ライン方式の2つのアーキテクチャを取り上げました。この2つの例でパフォーマンスを計測してみましょう。 ...
Get クラウドデータレイク ―無限の可能性があるデータを無駄なく活かすアーキテクチャ設計ガイド now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.