16章ディザスタプランニング

執筆:Michael Robinson、Sean Noonan

協力:Alex Bramley、Kavita Guliani

 システムではいずれは信頼性に関する障害やセキュリティインシデントが避けられないことから、それらに対処する準備を整えておく必要があります。それゆえ、実装フェーズの完了後は、開発サイクルの最後に向けてディザスタプランニング活動に取り組むことをお勧めします。

 本章はディザスタリスクの分析から始めますが、これは柔軟なディザスタ対応計画を立てるために必要なステップです。次に、インシデント対応チームの編成手順を概観し、ディザスタの発生前に実施できる事前準備活動を特定するためのヒントを示します。最後に、ディザスタが襲う前に行うべき組織のテストについて深く掘り下げ、Googleが特定のディザスタシナリオに備えた具体例を紹介します。

 複雑なシステムでは、想定外のサービス障害から、悪意のある当事者が不正アクセスを獲得しようとする攻撃まで、単純な障害も複雑な障害も発生する可能性があります。こうした障害は、信頼性エンジニアリングやセキュリティ上のベストプラクティスを通じて予測および防止できることもありますが、長期的に見ると障害はほぼ避けられません。

 システムがディザスタや攻撃から生き残ることや、スタッフが合理的な対応を取れることをただ願うのではなく、ディザスタプランニングは、ディザスタからリカバリ(復旧)できる能力を向上するための継続的な取り組みを確立します。幸い、包括的な戦略を策定するための最初のステップは、現実的で取り組みやすいものです。

16.1 「ディザスタ」の定義

 災害が猛威を振るう渦中になって初めて気づくというのは、めったにないものです。自分のいるビル全体がいきなり炎に包まれるのではなく、最初は煙を目にするか焦げ臭さを感じる可能性が高いでしょう。つまり、必ずしも災害とは思えない、一見すると大したことはない兆候です。その火は徐々に広がっていき、ぼうぼうと燃えさかるまでは危険な状況だと分からないのです。同様に、2章の冒頭で触れた会計ミスのような小さなイベントが、大々的なインシデント対応の引き金となることもあります。 ...

Get セキュアで信頼性のあるシステム構築 ―Google SREが考える安全なシステムの設計、実装、保守 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.