SLO サービスレベル目標 ―SLI、SLO、エラーバジェット導入の実践ガイド

Book description

サービスレベル目標(SLO)とは、ユーザーの満足度に強い相関があるメトリクスを用いた、開発と運用の目安となるものです。SLOに基づいた運用は、ユーザー視点で高い信頼性を持つサービスを提供する上で最も重要なプラクティスであるとともに、ビジネス指標に紐づく運用方法でもあります。本書は、SLOを導入する際に必要となる基礎概念、実装、文化を解説します。 はじめに、SLOの概要、サービスレベル指標(SLI)の設定、エラーバジェットの使い方などSLOの基本について説明します。そしてSLIとSLOの計測、確率と統計を使ったSLOの活用法、SLOを組み込むアーキテクチャやシステムについて解説します。さらに、組織内での同意の獲得やSLOの提唱など、SLOに基づくアプローチをチームや会社全体に根付かせる効果的な方法を紹介します。

Table of contents

  1.  表紙
  2.  大扉
  3.  原書大扉
  4.  クレジット
  5.  本書への推薦の言葉
  6.  序文
  7.  監訳者まえがき
  8.  はじめに
  9. 第Ⅰ部 SLOの開発
  10.  1章 信頼性スタック
  11.   1.1 サービスの真実
  12.   1.2 信頼性スタック
  13.   1.3 サービスとは何か
  14.   1.4 念頭におくべきこと
  15.   1.5 まとめ
  16.  2章 信頼性についての考え方
  17.   2.1 信頼性工学(リライアビリティエンジニアリング)
  18.   2.2 過去のパフォーマンスとユーザー
  19.   2.3 どの程度の信頼性が必要か
  20.   2.4 まとめ
  21.  3章 意味のあるサービスレベル指標の開発
  22.   3.1 意味のあるSLIがもたらすもの
  23.   3.2 多くの事象についての配慮
  24.   3.3 さらに複雑なもの
  25.   3.4 まとめ
  26.  4章 適切なサービスレベル目標の選択
  27.   4.1 信頼性の目標値
  28.   4.2 サービスの依存対象とコンポーネント
  29.   4.3 所有していないものに対する信頼性
  30.   4.4 目標値の選択
  31.   4.5 まとめ
  32.  5章 エラーバジェットの使い方
  33.   5.1 実際のエラーバジェット
  34.   5.2 エラーバジェットの計測
  35.   5.3 まとめ
  36. 第Ⅱ部 SLOの実装
  37.  6章 同意の獲得
  38.   6.1 エンジニア仕事はコードだけではない
  39.   6.2 主要な利害関係者
  40.   6.3 活動方針
  41.   6.4 苦労して習得した教訓
  42.   6.5 まとめ
  43.  7章 SLIとSLOの計測
  44.   7.1 設計目標
  45.   7.2 通常の仕組み
  46.   7.3 よくある事例
  47.   7.4 一般的な場合
  48.   7.5 その他の考慮事項
  49.   7.6 まとめ
  50.  8章 SLOの監視とアラート
  51.   8.1 動機:SLOアラートとは何か、そしてなぜそれを実行すべきなのか?
  52.   8.2 SLOのアラートの実行方法
  53.   8.3 別れの推奨事項
  54.   8.4 まとめ
  55.  9章 SLIとSLOの確率と統計
  56.   9.1 確率について
  57.   9.2 統計について
  58.   9.3 SLIの例:耐久性
  59.   9.4 さらに詳細な参考資料
  60.   9.5 まとめ
  61.  10章 信頼性を得るためのアーキテクチャ
  62.   10.1 サンプルシステム:画像提供サービス
  63.   10.2 アーキテクチャに関する検討事項:ハードウェアについての再考
  64.   10.3 システムのSLIの結果としてのSLO
  65.   10.4 依存関係の識別および理解の重要性
  66.   10.5 まとめ
  67.  11章 データの信頼性
  68.   11.1 データサービス
  69.   11.2 データサービスのユーザー
  70.   11.3 計測可能なデータの目標の設定
  71.   11.4 システム設計の関心事
  72.   11.5 データリネージ
  73.   11.6 まとめ
  74.  12章 適切に機能した例
  75.   12.1 犬にも服を着せるべき
  76.   12.2 ユーザージャーニーとしてのSLIとSLO
  77.   12.3 まとめ
  78. 第Ⅲ部 SLOの文化
  79.  13章 SLO文化の構築
  80.   13.1 SLOのない文化
  81.   13.2 文化を移行するための戦略
  82.   13.3 SLOの文化への道
  83.   13.4 まとめ
  84.  14章 SLOの進化
  85.   14.1 SLO事始め
  86.   14.2 使用方法の変更
  87.   14.3 依存関係の変更
  88.   14.4 障害に誘発される変更
  89.   14.5 ユーザーの期待と要求の変更
  90.   14.6 ツールの変更
  91.   14.7 直感に基づく変更
  92.   14.8 野心的なSLOの設定
  93.   14.9 不正確なSLOの識別
  94.   14.10 SLOの変更方法
  95.   14.11 まとめ
  96.  15章 発見可能で理解可能なSLO
  97.   15.1 理解可能性
  98.   15.2 発見可能性
  99.   15.3 まとめ
  100.  16章 SLOの提唱
  101.   16.1 クロール
  102.   16.2 ウォーク
  103.   16.3 ラン
  104.   16.4 まとめ
  105.  17章 信頼性のレポート
  106.   17.1 基本的なレポート
  107.   17.2 高度なレポート
  108.   17.3 まとめ
  109.  付録A SLOの定義のテンプレート
  110.   A.1 SLOの定義:サービスの名前
  111.   A.2 サービスの概要
  112.   A.3 SLIとSLO
  113.   A.4 論拠
  114.   A.5 再考のスケジュール
  115.   A.6 エラーバジェットポリシー
  116.   A.7 外部リンク
  117.  付録B 9章の証明
  118.   B.1 定理1
  119.   B.2 定理2
  120.   B.3 定理3
  121.   B.4 定理4
  122.   B.5 定理5
  123.   B.6 定理6
  124.   B.7 定理7
  125.  著者紹介
  126.  奥付

Product information

  • Title: SLO サービスレベル目標 ―SLI、SLO、エラーバジェット導入の実践ガイド
  • Author(s): Alex Hidalgo, 山口 能迪, 成田 昇司
  • Release date: July 2023
  • Publisher(s): O'Reilly Japan, Inc.
  • ISBN: 9784814400348

You might also like

book

ユニコーン企業のひみつ ―Spotifyで学んだソフトウェアづくりと働き方

by Jonathan Rasmusson, 島田 浩二, 角谷 信太郎

大規模な成功を収めているテック企業(ユニコーン企業)は、スタートアップで機能していたテクニックをエンタープライズ企業レベルにまでスケールさせる方法を見いだし、日々実践しています。Amazon、Facebook、Googleなどは、何万人もの従業員を抱えているにもかかわらず、スタートアップのように働いています。本書はSpotifyでアジャイルコーチやエンジニアの経験を持つ著者がユニコーン企業のソフトウェアづくりと働き方を解説します。 ミッションによってチームに目的を持たせ、スクワッドに権限を与え、信頼する。カンパニーベットを通じて大規模な取り組みを調整する。このような働き方とそれを実現するための文化のあり方を解説し、複数チームが連携しながら質の高いプロダクトを早くリリースし、迅速に技術革新を行うための方法を学びます。 プロダクトのデリバリーにフォーカスする世界有数のテック企業の事例を紹介する本書は、デリバリープロセスやプロダクト組織自体を改善したいエンジニアやマネージャー、経営リーダー必携の一冊です。

book

人工知能のアーキテクトたち ―AIを築き上げた人々が語るその真実

by Martin Ford, 松尾 豊, 水原 文

真の汎用技術として社会を大きく変えつつある人工知能(AI)。本書は、AIの最前線に立ち続けている23人の研究者、起業家へのインタビュー集です。聞き手は『テクノロジーが雇用の75%を奪う』などの著書を持つマーティン・フォード。インタビュー対象は、ジェフリー・ヒントン、ヨシュア・ベンジオ、ヤン・ルカン、デミス・ハサビス、ジェフリー・ディーン、フェイフェイ・リー、アンドリュー・エン、ニック・ボストロム、レイ・カーツウェルなど、いずれもこの分野の中心人物です。議論の内容は、深層学習の成果、人間レベルのAIの実現の可能性、中国の存在、さらに雇用への影響やユニバーサルベーシックインカムにいたるまで幅広く、これらについての異なる立場からの見解を知ることで、AIの過去、現在、そして未来を、多面的に、より深く理解することが可能になります。

book

組織を変える5つの対話 ―対話を通じてアジャイルな組織文化を創る

by Douglas Squirrel, Jeffrey Fredrick, 宮澤 明日香, 中西 健人, 和智 右桂

対話を変えれば組織文化も変わる―。組織内の対話を変えることで、アジャイルな組織文化を築くための実践的な方法を解説します。 オープンな自己表現と相手への理解を促進する「対話診断」を使い、信頼と心理的安全性を築きながら共通の目標に向かって進むための会話の進め方を紹介します。5つの対話ステップ(信頼の構築、心理的安全性の確立、目的の共有、コミットメントの構築、説明責任の遂行)を実例とともに解説し、日々のコミュニケーションを通じて組織内のエネルギーを高めて革新を促す方法を提案します。 迅速な意思決定と主体性を育むアジャイルな組織文化への変革を目指すリーダーやチームメンバー必携の一冊です。

book

ルールズ・オブ・プログラミング ―より良いコードを書くための21のルール

by Chris Zimmerman, 久富木 隆一

全世界で1,000万本に迫る実売数を誇り、日本でも累計実売数100万本を突破(2023年5月時点)した大ヒットゲーム『Ghost of Tsushima (ゴースト・オブ・ツシマ) 』をはじめ、『怪盗スライ・クーパー』などで著名なゲーム制作スタジオ、Sucker Punch Productions(サッカーパンチプロダクションズ)の共同創設者であるChris Zimmermanによる、プログラミングのベストプラクティス集。 全部で21の「ルール」から成り立っており、すべてのプログラマーが知っておくべき本質的な知恵と、熟練したプログラマーにとって示唆に富む洞察を含んでいます。また、コードを書く際だけでなく、デバッグや最適化の際に有用な知識にも触れています。ゲーム領域に限らず、幅広いプログラマーを対象とした、必読のプログラミング哲学。 本書で触れられるコード例はC++で書かれていますが、C++の知識は必須ではなく、オブジェクト指向の基礎知識さえあれば問題なく読むことができます。また、付録に「Pythonプログラマー/JavaScriptプログラマーのためのC++コード読解法」を掲載しています。