2章信頼性についての考え方

Alex Hidalgo

テクノロジー業界には、特定の用語や語句、または原理に夢中になり、それらが意味のないマーケティング用語になるまで乱用し尽くすという癖があります。最近のよく知られた事例の1つは、DevOpsという用語です。これは、問題解決の特定のアプローチを説明するために作られた用語です。DevOpsは当初、開発のリリースサイクルを短縮し、より速いフィードバックループの実現を支援する原理となるよう意図されていましたが、現在では多くの場合、職種として使用されたり、ベンダーのツールのカテゴリに割り当てられたりしています。そしてもう1つ、本書の関連する代表的な例として、サイトリライアビリティエンジニアリング(SRE)という用語と、それに伴うリライアビリティ、つまり信頼性という言葉が挙げられます。

テクノロジー業界にとって、信頼性とは可用性のみを意味する場合があまりに多くなっています。可用性と信頼性は密接に関係しています。しかし、可用性だけですべてを説明し尽くせるわけではありません。信頼性堅牢性回復力(レジリエンス)などの言葉を、コンピューターサービスに関する話題で使用するとき、残念ながらそれぞれの元の意味は外れています。アップタイムダウンタイムなどの一般的な単語が、事態をさらに複雑にします。人々が「アップしているか?」というとき、それは常に「バイナリが実行されているか?」を意味するわけではないからです。それらの言葉は、さらに微妙な何かを意味することもあります。

新しく登場する用語は、いずれも目新しくはありません。信頼性工学の原理は、新しい発明でも発想でもないのです。サービスレベル目標(SLO)は、多くの場合テクノロジー業界と結び付けられたアプローチですが、システムの信頼性を検討したり、計測したり、あるいは予測するためのモデルを構築することは、ずっと長い期間において、多くの工学分野でプラクティスとして行われてきました。システムにとっての信頼性とは、ユーザーが必要とする動作をシステムが実行することを意味しています。信頼性工学の原理は、コンピューターシステムでも信頼性を達成するために役立ちます。 ...

Get SLO サービスレベル目標 ―SLI、SLO、エラーバジェット導入の実践ガイド now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.