Ingegneria dell'affidabilità dei siti
by Niall Richard Murphy, Betsy Beyer, Chris Jones, Jennifer Petoff
Parte II. I principi
Questa sezione esamina i principi alla base del funzionamento tipico dei team SRE: modelli, comportamenti e aree di interesse che influenzano il dominio generale delle operazioni SRE.
Il primo capitolo di questa sezione, e il più importante da leggere se vuoi ottenere un quadro più ampio di cosa fa esattamente SRE e di come ragioniamo su di esso, è il Capitolo 3, Abbracciare il rischio, che analizza SRE attraverso la lente del rischio - la sua valutazione, la sua gestione e l'uso dei bilanci degli errori per fornire approcci utilmente neutrali alla gestione dei servizi.
Gli obiettivi di livello di servizio sono un'altra unità concettuale fondamentale per SRE. Il settore comunemente raggruppa concetti diversi sotto la bandiera generale degli accordi sui livelli di servizio, una tendenza che rende più difficile pensare a questi concetti in modo chiaro. Il Capitolo 4, Obiettivi del livello di servizio, cerca di distinguere gli indicatori dagli obiettivi e dagli accordi, esamina l'uso che SRE fa di ciascuno di questi termini e fornisce alcune raccomandazioni su come trovare metriche utili per le tue applicazioni.
Eliminare la fatica è uno dei compiti più importanti di SRE ed è l'argomento del Capitolo 5, Eliminare la fatica. Definiamo la fatica come un lavoro operativo banale e ripetitivo che non fornisce alcun valore duraturo e che aumenta linearmente con la crescita del servizio.
Che sia in Google o altrove, il monitoraggio è una componente assolutamente essenziale ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access