4章サービスレベル目標

執筆:Chris Jones、John Wilkes、Niall Murphy

執筆協力:Cody Smith

編集:Betsy Beyer

言うまでもないことですが、サービスを適切に管理するには、サービスの中で特に重要な振る舞いがどれかということと、そういった振る舞いの計測と評価の方法を理解しなければなりません。そのために、私たちはユーザーに対するサービスレベルを定義し、達成しようとします。このことは、ユーザーが使うのが内部APIであっても、公開されているプロダクトであっても変わりません。

私たちは、サービスレベル指標(service level indicators = SLI)、サービスレベル目標(service level objectives = SLO)、サービスレベルアグリーメント(service level agreements = SLA)を定義する際に、直感、経験、そしてユーザーが求めていることへの理解を活用します。こういった計測値は、注目すべきメトリクスの基本的な属性、そういったメトリクスの望ましい値、値を期待通りにできなかった場合への対応方法などを示すものです。究極的には、適切なメトリクスを選択することで、何か問題があったときに適切なアクションを取りやすくなります。そしてまたSREチームは、サービスが健全な状態にあることを確信できるのです。

本章では、メトリクスのモデリング、選択、分析に取り組むにあたって、私たちが使っているフレームワークについて説明します。この説明の多くは、サンプルなしではきわめて抽象的になってしまうので、「2.6 シェークスピア:サンプルのサービス」で概要を説明したシェークスピアサービスを使って、主要なポイントを説明していきます。 ...

Get SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.