Skip to Content
サイトリライアビリティワークブック ―SREの実践方法
book

サイトリライアビリティワークブック ―SREの実践方法

by Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara, Stephen Thorne, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, 玉川 竜司
June 2020
Intermediate to advanced
516 pages
7h 4m
Japanese
O'Reilly Japan, Inc.
Content preview from サイトリライアビリティワークブック ―SREの実践方法

付録Bエラーバジェットポリシーの例

ステータス公開
作者Steven Thurgood
日付2018-02-19
レビューアーDavid Ferguson
承認者Betsy Beyer
承認日2018-02-20
再訪日2019-02-01

サービスの概要

サンプルゲームサービスは、Android及びiPhoneのユーザーがお互いにゲームを遊べるようにする。バックエンドコードの新リリースは日次でプッシュされる。クライアントの新リリースは週次でプッシュされる。このポリシーは、バックエンドとクライアントのどちらのリリースにも適用される。

目標

このポリシーの目標は以下のとおり。

  • 反復的なSLO違反から顧客を保護する
  • 信頼性とその他の機能とのバランスを取るための動機付けを提供する

目標ではないこと

このポリシーは、SLO違反に対する処罰として働くことを意図していない。変更を止めることは望ましくない。このポリシーは、信頼性がプロダクトの他の機能よりも重要であることをデータが示している場合に、チームが信頼性にのみ集中する権限を与えるものである。

SLO違反のポリシー

サービスがSLOに沿って、あるいはそれ以内で動作しているなら、リリース(データ変更を含む)はリリースポリシーに従って進められる。

サービスが直近の4週間のウィンドウでエラーバジェットを超過したら、P0†1の問題あるいはセキュリティの修正を除くすべての変更とリリースを、サービスがSLO内に回復するまで停止する。

SLO違反の原因によって、チームは機能の作業の代わりに信頼性に関する作業に追加のリソースを割くことがある。

以下の場合、チームは信頼性に関する作業をしなければならない

  • コードのバグあるいは手続き的なエラーがサービスそのもののエラーバジェット超過を引き起こした。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎

Andreas C. Muller, Sarah Guido, 中田 秀基
プログラミングRust

プログラミングRust

Jim Blandy, Jason Orendorff, 中田 秀基
初めてのGraphQL ―Webサービスを作って学ぶ新世代API

初めてのGraphQL ―Webサービスを作って学ぶ新世代API

Eve Porcello, Alex Banks, 尾崎 沙耶, あんどうやすし

Publisher Resources

ISBN: 9784873119137Other