Kapitel 8. Bereitschaftsdienst

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bereitschaftsdienst bedeutet, dass man während eines bestimmten Zeitraums verfügbar ist und in dieser Zeit mit der entsprechenden Dringlichkeit auf Störungen in der Produktion reagieren kann. Site Reliability Engineers (SREs) müssen oft an Rufbereitschaftsschichten teilnehmen. Während der Bereitschaftsschichten diagnostizieren, entschärfen, beheben oder eskalieren SREs Störungen je nach Bedarf. Darüber hinaus sind SREs regelmäßig für nicht dringende Aufgaben in der Produktion zuständig.

Bei Google ist der Bereitschaftsdienst eines der wichtigsten Merkmale von SRE. SRE-Teams entschärfen Zwischenfälle, beheben Produktionsprobleme und automatisieren betriebliche Aufgaben. Da die meisten unserer SRE-Teams ihre betrieblichen Aufgaben noch nicht vollständig automatisiert haben, brauchen sie bei Eskalationen menschliche Ansprechpartner - Ingenieure auf Abruf. Je nachdem, wie kritisch die unterstützten Systeme sind oder in welchem Entwicklungsstadium sie sich befinden, müssen nicht alle SRE-Teams auf Abruf bereitstehen. Unserer Erfahrung nach besetzen die meisten SRE-Teams Bereitschaftsschichten.

Die Rufbereitschaft ist ein großes und komplexes Thema, das mit vielen Einschränkungen und ...

Get Das Arbeitsbuch zur Standortzuverlässigkeit now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.