Ingénierie de la fiabilité des sites
by Niall Richard Murphy, Betsy Beyer, Chris Jones, Jennifer Petoff
Partie IV. La gestion
Notre dernière sélection de sujets couvre le travail en équipe et le travail en tant qu'équipe. Aucun SRE n'est une île, et il existe des méthodes de travail qui nous sont propres.
Toute organisation qui aspire à être sérieuse dans la gestion d'une branche SRE efficace doit envisager la formation. Apprendre aux SRE à penser dans un environnement compliqué et en évolution rapide grâce à un programme de formation bien pensé et bien exécuté promet d'inculquer à un nouvel employé, dès les premières semaines ou les premiers mois, les meilleures pratiques qui, autrement, prendraient des mois ou des années à s'accumuler. Nous discutons des stratégies pour y parvenir au chapitre 28, Accélérer le passage des SRE à l'astreinte et au-delà.
Comme toute personne travaillant dans le monde des opérations le sait, la responsabilité d'un service important s'accompagne de nombreuses interruptions : la production qui se met en mauvais état, les gens qui demandent des mises à jour de leur binaire préféré, une longue file d'attente de demandes de consultation... La gestion des interruptions dans des conditions turbulentes est une compétence nécessaire, comme nous le verrons au chapitre 29, Gérer les interruptions.
Si les turbulences persistent depuis assez longtemps, une équipe SRE doit commencer à récupérer de la surcharge opérationnelle. Nous avons justement le plan de vol qu'il te faut au chapitre 30, Intégrer un SRE pour se remettre d'une surcharge opérationnelle.
Nous écrivons ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access