Ingegneria dell'affidabilità dei siti
by Niall Richard Murphy, Betsy Beyer, Chris Jones, Jennifer Petoff
Capitolo 30. Incorporare una SRE per recuperare da un sovraccarico operativo
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
La politica standard dei team SRE di Google è quella di dividere equamente il proprio tempo tra progetti e lavoro operativo reattivo. In pratica, questo equilibrio può essere alterato per mesi da un aumento del volume giornaliero di ticket. Una quantità eccessiva di lavoro ops è particolarmente pericolosa perché il team SRE potrebbe esaurirsi o non riuscire a progredire nel lavoro di progetto. Quando un team deve dedicare una quantità sproporzionata di tempo alla risoluzione dei ticket a scapito del miglioramento del servizio, la scalabilità e l'affidabilità ne risentono.
Un modo per alleviare questo peso è trasferire temporaneamente un SRE nel team sovraccarico. Una volta inserito in un team, lo SRE si concentra sul miglioramento delle pratiche del team invece di aiutarlo semplicemente a svuotare la coda dei ticket. Lo SRE osserva la routine quotidiana del team e fornisce consigli per migliorare le sue pratiche. Questa consulenza offre al team una nuova prospettiva sulle sue routine che i membri del team non possono fornire da soli.
Quando si utilizza questo approccio, non è necessario trasferire più di un ingegnere. Due SRE non producono necessariamente risultati migliori e possono anzi causare problemi se il team ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access