21章サービスレベル目標の技法と科学

Theo Schlossnagle(Circonus)

期待の内容について誰も同意していなければ、期待に応えることも期待を超えることもできません。どのような仕事でも、成功度を計測するための目標を理解しなければなりません。本章では、SREが目標を設定するとはどのようなことかを学びます。

21.1 目標を設定する理由

SREの主たる目標はシステムの信頼性を維持することです。この目標について成功度を判断するためにSREが使う最も基本的な仕組みがサービスレベル目標(SLO)です。「仕事をうまくやる」と言っても「うまく」が明確に定義されていなければ難しいことは、理解してもらえるでしょう。この「うまく」を定義するために必要な言葉を与えるのがSLOというわけです。

サービスレベルアグリーメント(SLA)のほうが使い慣れているという人は多いかもしれませんので、ここから話を始めましょう。SLAについては、闇の核心だと考える人もいれば、救いの光だと考える人もいます。この相反する評価はどうしたことでしょうか。その理由はSLAをどのように定義するかにあると私は考えます。サービスの作成者と利用者がそれぞれの期待のレベルを設定できるように定義できる一方、失望、誤った保証、財務上の危うい負債にさらされるリスクをもたらす手段となる恐れもあるのです。闇の中に長居をしすぎないようにしましょう。

[注記]

現在ではSLOという用語を使うことが多くなっており、本章の目的からすると、SLAとは単純に、二者以上の当事者が「合意」したSLOです。この文脈ではSLOとSLAはほぼ同義語として使われますが、私たちSREとしては、SLAは「外部の」複数の当事者による合意、SLOは「内部の」単独の当事者による目標と考えるように心掛けています ...

Get SREの探求 ―様々な企業におけるサイトリライアビリティエンジニアリングの導入と実践 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.