3章原則の全体像
Netflixにおけるカオスエンジニアリングの黎明期には、この規律が実のところ何であるのか明確ではありませんでした。ケーブルを抜くとかモノを壊すとか、本番環境でテストするなどといったいくつかのキャッチフレーズが広まっていた一方、サービスの信頼性を高める方法には多くの誤解がありましたし、実際に使えるツールには非常に限りがありました。カオスチームは、ツールを通じてプロアクティブに信頼性を向上させられるような、有意義な規律を作りだすために結成されました。私たちはカオスエンジニアリングの定義と、他の人々がどのようにして参加するかの素案となるようなアイディアを得るべく、数ヶ月をレジリエンスエンジニアリングや他の規律の研究に費やしました。その定義は一種のマニフェスト(https://principlesofchaos.org/)としてオンライン公開されており、カオスエンジニアリングの「原則(Principles)」として言及されています(「イントロダクション:カオスの誕生」のカオスエンジニアリングがいかにして発生したかの物語も参照してください)。
どのような新しい概念にも起こりがちですが、カオスエンジニアリングはときに誤解されることがあります。後続のセクションではこの規律が何なのか、そして何でないのかを探究します。続いて実践方法の黄金律を、「3.3 発展した原則」で紹介します。最後に、原則を進展させる上ではどのような要素を変えればよいかを見ていきます。
3.1 カオスエンジニアリングとは何か
カオスエンジニアリングの原則は、私たちがどのようなときにカオスエンジニアリングを実践し、どうやって行い、またどうしたらうまくできるのかが分かるような規律を定義します。昨今におけるカオスエンジニアリングの一般的な定義は「システム的な弱点を発見するために行う実験の円滑化」です。カオスエンジニアリングの原則のウェブサイトでは、実験のステップを以下のようにまとめています。 ...
Get カオスエンジニアリング ―回復力のあるシステムの実践 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.