Rozdział 10. Praktyczne alarmy na podstawie szeregów czasowych
Autor: Jamie Wilkinson
Redakcja: Kavita Guliani
Niech zapytania płyną swobodnie, a pager będzie cicho.
— tradycyjne błogosławieństwo inżynierów SRE
Monitorowanie, dolna warstwa w hierarchii potrzeb środowiska produkcyjnego, jest niezbędne do zarządzania stabilną usługą. Umożliwia właścicielom usługi podejmowanie racjonalnych decyzji dotyczących wpływu zmian na usługę, stosowanie metody naukowej w reagowaniu na incydenty i uzasadnianie istnienia tych usług poprzez pomiar ich zgodności z celami biznesowymi (zob. rozdział 6.).
Niezależnie od tego, czy usługą zarządza zespół SRE, powinna ona działać w symbiozie z systemem monitorowania. Ponieważ zespoły SRE ostatecznie odpowiadają za ...
Get Site Reliability Engineering now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.