15章発見可能で理解可能なSLO
Alex Hidalgo
信頼性へのSLOに基づくアプローチは、すべての人が同じことを目指しているときに、もっとも効果的に機能します。したがって、組織に属するすべての人が同じようにそのプロセスに同意する必要があります。各チームは、自分たちの仕事の仕方、自分たちのサービスの内容、自分たちが利用できるデータと計測値の種類に対して、システムを自由に調整できなくてはなりません。その場合も、他のすべての人との間で首尾一貫した用語と定義を使用する必要があります。他のチームやメンバーとの間で、理解を共有するためです。言葉の表現が多岐にわたると、SLOの利点の1つが失われます。それは、サービスの信頼性がどのように定義されているか、また現在の状態がどうなっているのかを、他の人々と素早く直感的に理解する機能です。
SLOの定義を一貫性のあるものにするだけでなく、他の人々がSLOを発見できることも重要です。自分のシステムでSLOの定義と詳細をどれほど説明できていても、他者が発見できなければ意味はありません。
この章では、SLOを発見しやすくして、より良く知るためのベストプラクティスと、その他のヒントに焦点を当てます。
15.1 理解可能性
SLOの定義は、関係者全員が理解できるものにしてください。これはあなた自身のチームから始まります。サービスを管理する責任者全員は、あなたが定義するSLI、SLO、およびエラーバジェットポリシーに同意する必要があります。すべての人がその内容を正確に理解していなければ、適正な合意を得ていることにはなりません。
そのうえで、SLOを他のチームのエンジニアに理解してもらう必要があります。彼らは、あなたのサービスの直接のユーザーであったり、あなたのサービスに依存するサービスを運用しています。彼らは、そのサービスの動作方法を理解する必要があり、あなたが計測対象をどう選択したのかを知らないかぎり、先に進めません(理解を広める方法については、 ...
Get SLO サービスレベル目標 ―SLI、SLO、エラーバジェット導入の実践ガイド now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.