サイトリライアビリティワークブック ―SREの実践方法
by Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara, Stephen Thorne, 澤田 武男, 関根 達夫, 細川 一茂, 矢吹 大輔, 玉川 竜司
2章SLOの実装
執筆:Steven Thurgood、David Ferguson
協力:Alex Hidalgo、Betsy Beyer
サービスレベル目標(Service Level Objective = SLO)は、サービスの信頼性の目標レベルを示すものです。SLOは信頼性に関してデータ駆動型の意思決定を下す上で鍵となるものなので、SREの実践の中核といえます。多くの面で、本章は本書の中で最も重要な章です。
いくつかの考え方を身につければ、初めのSLOとそれらを改良していくプロセスをセットアップすることは難しくありません。『SRE サイトリライアビリティエンジニアリング』の「4章 サービスレベル目標」では、SLOとSLI(Service Level Indicator = サービスレベル指標)を紹介し、それらの使い方についていくつかのアドバイスを提供しました。
本章では、SLOやエラーバジェットの背景にある動機について説明した後、SLOについて考え始めるための項目を順を追って紹介し、そこからのイテレーションに関するアドバイスも提供します。そして効果的なビジネス上の判断を下すためのSLOの使い方を取り上げ、いくつかの発展的なトピックを見ていきます。最後に、様々な種類のサービスにおけるSLOの例と、特定の状況下におけるさらに洗練されたSLOの作り方についての指針を示します†1。
2.1 SREにSLOが必要な理由
巨大な組織においてさえも、エンジニアは限りのあるリソースです。エンジニアリングにかける時間は、最も重要なサービスの最も重要な部分に投資されるべきです。新しい顧客を得たり現状の顧客を保ったりするような機能への投資と、それらの顧客を満足させ続けるような信頼性とスケーラビリティへの投資との適切なバランスを見いだすのは難しいことです。私たちがGoogleで学んだのは、十分に考えられて選択されたSLOは、信頼性に関する作業の機会コストについてデータに基づく判断をしたり、その作業の適切な優先順位を決定する上で鍵となるということです。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access