Ingénierie de la fiabilité des sites
by Niall Richard Murphy, Betsy Beyer, Chris Jones, Jennifer Petoff
Chapitre 22. Remédier aux défaillances en cascade
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Si au début tu ne réussis pas, recule de façon exponentielle.
Dan Sandler, ingénieur logiciel chez Google
Pourquoi les gens oublient-ils toujours qu'il faut ajouter un peu de gigue ?
Ade Oshineye, défenseur des développeurs de Google
Une défaillance en cascade est une défaillance qui s'amplifie au fil du temps en raison d'une rétroaction positive.1 Elle peut se produire lorsqu'une partie d'un système global tombe en panne, ce qui augmente la probabilité que d'autres parties du système tombent en panne. Par exemple, une seule réplique d'un service peut tomber en panne à cause d'une surcharge, ce qui augmente la charge sur les répliques restantes et augmente leur probabilité de tomber en panne, provoquant un effet domino qui met hors service toutes les répliques d'un service.
Nous utiliserons le service de recherche Shakespeare dont il est question dans"Shakespeare : Un exemple de service" comme exemple tout au long de ce chapitre. Sa configuration de production pourrait ressembler à lafigure 22-1.
Figure 22-1. Exemple de configuration de production pour le service de recherche Shakespeare
Causes des défaillances en cascade et conception pour les éviter
Une conception bien ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access