Rozdział 5. Google DiRT i testowanie odzyskiwania po awarii
Jason Cahoon
„Nadzieja to nie strategia” — tak brzmi motto zespołu Site Reliability Engineering (SRE) w Google i idealnie oddaje ono główną filozofię inżynierii chaosu. System może być budowany tak, by znosił awarie, ale dopóki jawnie nie przetestujesz warunków awaryjnych w dużej skali, zawsze będzie istniało ryzyko, że rzeczywistość nie sprosta oczekiwaniom. Program DiRT (ang. Disaster Recovery Testing — testowanie odzyskiwania po awarii) w Google został zorganizowany przez inżynierów Site Reliability (SRE) w 2006 r., by intencjonalnie wprowadzać awarie w kluczowych systemach technologicznych i procesach biznesowych w celu ujawnienia nieznanych, a przez to niewziętych pod uwagę ryzyk. ...
Get Inżynieria chaosu now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.