
14.1
サービスの継続性
273
信頼性の低いインフラストラクチャのもとでのシステム
クラウドスケールでは、ハードウェアはかならず壊れる。高い信頼性を目指して作られた
ハードウェアでも、このことに違いはない。
1
万、
10
万単位の数で集められたサーバーは、
99.999%
の信頼性があってもどれかが壊れる。そのため、ハードウェアエラーに耐えられる
システムを設計せざるを得なくなる。
Google
、
Facebook
、
Amazon
などの大規模インフラストラクチャを運営する企業は、規
模の経済から、安価なコモディティハードウェアを使ってそれぞれのインフラストラクチャを
構築している。いずれにしてもシステムやソフトウェアにハードウェアエラー耐性を組み込ま
なければならないので、信頼性の高いハードウェアのために高いコストをかけても意味はな
い。システムが避けがたく発生する故障に対応できることがわかっているので、故障したハー
ドウェアは単純に交換してしまった方がコストがかからないのだ。
Sam Jonston
は、信頼できるハードウェアで実行される信頼性の低い(不安定なインフラ
ストラクチャに対する耐性が低い)ソフトウェアから、信頼性の低いハードウェアで信頼性の
高いソフトウェアを実行する方向へのシフトだと言っている(
https://samj.net/2012/03/08/
simplifying-cloud-reliability/
)。
14.1.4
継続性のためのコンパートメント化
小さくて疎結合な部品を目指すアーキテクチャは、継続 ...