第1章 はじめに
この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com
レジリエンスとは、混乱や障害、予期せぬ事象に耐え、そこから回復するシステムの能力のことである。障害を防ぎ、システムが優雅に劣化し、、迅速に回復し、ストレス下でもある程度の機能を提供できるようにすることである。
では、組織はどのようにしてレジリエンスを達成するのだろうか?この目標を達成するためには、組織の側がクラウドの専門知識とエンジニアリング、自動化ツールに投資することを継続的に追求し、レジリエンスについて継続的に学習する文化を受け入れようとする姿勢が必要である。
人、プロセス、テクノロジー
レジリエンス・システムを作成するには、テクノロジーだけでなく、人とプロセスの統合も必要である。テクノロジーは、レジリエンスのためのツールやプラットフォームを提供するものであるが、レジリエントなシステム設計の成否を最終的に左右するのは、これらのツールを実装し、管理する人であり、彼らが従うプロセスである。
人の役割
レジリエンス・システムの原動力は人である。ビジネス利害関係者、エンジニ ア、アーキテクト、演算子、およびその他の専門家を含む熟練した専門家は、これらのシス テムの設計、実装、および保守に必要な専門知識をもたらす。技術的な状況と組織のビジネス要件に関する知識によって、ビジネスが要求する最適なパフォーマ ンスとレジリエンスを備えたシステムが構築される。
急速に進化するテクノロジー環境に適応するためには、継続的なトレーニングと能力開発が不可欠である。チームに最新のスキルと知識を持たせることで、チームメンバーは新しいツールや方法論を効果的に活用してレジリエンスを高めることができる。
レジリエンス・システムの構築には、機能横断要件が必要である。、製品、開発、運用、セキュリティなどのチーム間で明確なコミュニケーションをとることで、システムのあらゆる側面が考慮され、ビジネス要件に対応できるようになる。
混乱に直面した場合、チームには迅速な対応と適応能力が求められる。十分に準備されたアジャイルなチームは、コンティンジェンシープランを迅速に実装し、問題をトラブルシューティングし、、サービスを復旧させ、停止時間と影響を最小限に抑えることができる。
プロセスの役割
プロセスは、人々が活動するための枠組み()を提供し、一貫性、効率性、組織目標との連携を確保する。よく定義されたプロセスは、ベストプラクティスを標準化し、 エラーを減らし、システムのレジリエンスを高める。
詳細なインシデントレスポンス計画()には、さまざまな混乱時にとるべき措置が概説されている。これらの計画は定期的に更新され、実際のインシデント発生時に有効性を確認するためにテストされるべきである。
変更管理プロセスを実装すれば、システムの更新や変更に伴うリスクを軽減できる。変更を慎重に計画し、テストし、監視することで、システムのレジリエンスが損なわれるような予期せぬ結果を防ぐことができる。
システム・パフォーマンスを継続的にモニタリングし、レジリエンス戦略を定期的に見直すことで、システムは進化するディスラプションに対して堅牢性を維持することができる。このプロセスには、データの収集、傾向の分析、レジリエンスを向上させるための十分な情報に基づく調整が含まれる。
システム、プロセス、インシデント履歴を包括的に文書化することで、知識の共有が促進され、チームメンバー全員が情報を入手し、準備を整えることができる。この実践は、一貫性を維持し、個人の専門知識への依存を減らすのに役立つ。 ...