Capitolo 3. Avvisi, reperibilità e gestione degli incidenti
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
L'avviso di è una delle parti più cruciali del monitoraggio che vorrai realizzare al meglio. Per qualche motivo, l'infrastruttura va in tilt nel cuore della notte. Perché sono sempre le 3 del mattino? Non posso avere un'interruzione alle 14:00 di martedì? Senza gli avvisi, saremmo tutti costretti a fissare i grafici per tutto il giorno, tutti i giorni. Con la moltitudine di cose che potrebbero andare storte e la crescente complessità dei nostri sistemi, questa situazione non è semplicemente sostenibile.
Quindi, gli avvisi. Siamo tutti d'accordo sul fatto che gli avvisi sono una funzione importante di un sistema di monitoraggio. Tuttavia, a volte dimentichiamo che lo scopo del monitoraggio non è solo quello di inviare avvisi. Ricorda la nostra definizione:
Il monitoraggio è l'azione di osservare e controllare il comportamento e i risultati di un sistema e dei suoi componenti nel tempo.
Gli avvisi sono solo un modo per raggiungere questo obiettivo.
Un ottimo alerting è più difficile di quanto sembri. Le metriche di sistema tendono ad avere dei picchi, quindi gli avvisi basati su dati grezzi tendono a produrre molti falsi allarmi. Per ovviare a questo problema, spesso si applica una media mobile ai dati per renderli più omogenei (ad esempio, cinque minuti di punti dati mediati in un ...