Kapitel 5. Alarmierung bei SLOs
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In diesem Kapitel erfährst du, wie du deine SLOs in umsetzbare Warnmeldungen zu wichtigen Ereignissen verwandelst. Sowohl unser erstes SRE-Buch als auch dieses Buch behandeln die Implementierung von SLOs. Wir sind der Meinung, dass gute SLOs, die die Zuverlässigkeit deiner Plattform aus Sicht deiner Kunden messen, die besten Anhaltspunkte dafür liefern, wann ein Bereitschaftsingenieur reagieren sollte. Hier geben wir konkrete Anleitungen, wie du diese SLOs in Alarmierungsregeln umwandelst, damit du auf Probleme reagieren kannst, bevor sie zu viel von deinem Fehlerbudget verbrauchen.
In unseren Beispielen stellen wir eine Reihe von zunehmend komplexeren Implementierungen für Alarmierungsmetriken und -logik vor und erörtern den Nutzen und die Unzulänglichkeiten jeder einzelnen. Obwohl unsere Beispiele einen einfachen anfragegesteuerten Dienst und die Prometheus-Syntax verwenden, kannst du diesen Ansatz in jedem Alerting-Framework anwenden.
Überlegungen zur Warnung
Um Warnungen aus Service Level Indicators (SLIs) und einem Fehlerbudget zu generieren, brauchst du eine Möglichkeit , diese beiden Elemente in einer bestimmten Regel zu kombinieren. Dein Ziel ist es, bei einem wichtigen Ereignis benachrichtigt zu werden: ein ...
Get Das Arbeitsbuch zur Standortzuverlässigkeit now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.