2章SLOの実装
執筆:Steven Thurgood、David Ferguson
協力:Alex Hidalgo、Betsy Beyer
サービスレベル目標(Service Level Objective = SLO)は、サービスの信頼性の目標レベルを示すものです。SLOは信頼性に関してデータ駆動型の意思決定を下す上で鍵となるものなので、SREの実践の中核といえます。多くの面で、本章は本書の中で最も重要な章です。
いくつかの考え方を身につければ、初めのSLOとそれらを改良していくプロセスをセットアップすることは難しくありません。『SRE サイトリライアビリティエンジニアリング』の「4章 サービスレベル目標」では、SLOとSLI(Service Level Indicator = サービスレベル指標)を紹介し、それらの使い方についていくつかのアドバイスを提供しました。
本章では、SLOやエラーバジェットの背景にある動機について説明した後、SLOについて考え始めるための項目を順を追って紹介し、そこからのイテレーションに関するアドバイスも提供します。そして効果的なビジネス上の判断を下すためのSLOの使い方を取り上げ、いくつかの発展的なトピックを見ていきます。最後に、様々な種類のサービスにおけるSLOの例と、特定の状況下におけるさらに洗練されたSLOの作り方についての指針を示します†1。
2.1 SREにSLOが必要な理由
巨大な組織においてさえも、エンジニアは限りのあるリソースです。エンジニアリングにかける時間は、最も重要なサービスの最も重要な部分に投資されるべきです。新しい顧客を得たり現状の顧客を保ったりするような機能への投資と、それらの顧客を満足させ続けるような信頼性とスケーラビリティへの投資との適切なバランスを見いだすのは難しいことです。私たちがGoogleで学んだのは、十分に考えられて選択されたSLOは、信頼性に関する作業の機会コストについてデータに基づく判断をしたり、その作業の適切な優先順位を決定する上で鍵となるということです。 ...
Get サイトリライアビリティワークブック ―SREの実践方法 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.