Ingénierie de la fiabilité des sites
by Niall Richard Murphy, Betsy Beyer, Chris Jones, Jennifer Petoff
Chapitre 11. Être de garde
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
Être d'astreinte est une tâche essentielle que de nombreuses équipes d'exploitation et d'ingénierie doivent assumer pour que leurs services restent fiables et disponibles. Cependant, l'organisation des rotations et des responsabilités d'astreinte comporte plusieurs pièges qui, s'ils ne sont pas évités, peuvent entraîner de graves conséquences pour les services et pour les équipes. Ce chapitre décrit les principes fondamentaux de l'approche de l'astreinte que les ingénieurs de fiabilité des sites (SRE) de Google ont développée au fil des ans, et explique comment cette approche a permis d'obtenir des services fiables et une charge de travail durable au fil du temps.
Introduction
Plusieurs professions exigent que les employés effectuent une sorte d'astreinte, ce qui implique d'être disponible pour les appels pendant les heures de travail et les heures creuses. Dans le contexte informatique, les activités d'astreinte ont toujours été effectuées par des équipes d'exploitation dédiées, chargées de la responsabilité principale de maintenir le(s) service(s) dont elles sont responsables en bonne santé.
De nombreux services importants de Google, tels que Search, Ads et Gmail, disposent d'équipes dédiées de SRE responsables de la performance et de la fiabilité de ces services. Les ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access