7章LinkedIn メンバーに対して配慮すること
本番環境でカオス実験を行うときは、常にプロダクトのユーザに影響を及ぼしてしまう可能性と隣り合わせです。忠実なユーザなくしては維持すべきシステムも成立しない以上、慎重に実験を計画する中でもユーザは最重視するようにしましょう。多少の小さな影響は避けられないとしても、カオス実験の影響範囲を局所化し、すべてを元の状態に戻すためのシンプルなリカバリプランを持つことは非常に重要です。実際、影響範囲を局所化することはカオスエンジニアリングの発展した原則の1つです(3章参照)。本章では、この原則に沿ったベストプラクティスを、ソフトウェア業界でどのように実装されてきたのかの物語に沿って学びます。
このテーマを文脈の中で考えるべく、少し自動車業界の話題へギアチェンジしてみましょう。あらゆる現代の自動車は、事故に遭った時の乗客の安全を入念に検査するため、製造メーカーや第三者、政府から厳格なクラッシュテスト(衝突試験)を課されます。これらの検証では、実際の人間が衝突によってどのくらいの衝撃を受けるかを判断するため、複数のセンサーをつけたクラッシュテスト用のダミー人形を活用します。
自動車事故のテスト用のダミー人形は、過去数十年間の間に著しい進化を遂げてきました。2018年には、NHTSA(National Highway Traffic Safety Administration)が、史上最も生身の人間に近いダミー人形と呼ばれるThorを発表しました。Thorは140ものデータチャンネルを備え、事故がどのように人間に衝撃を与えるかに関する豊富なデータをエンジニアにもたらします。このようなダミー人形は、製造メーカーや政府が車両を市場に出す上での信頼を裏付けるものになります ...
Get カオスエンジニアリング ―回復力のあるシステムの実践 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.