Kapitel 9. Vom SysAdmin zum SRE in 8.963 Wörtern

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Wenn du es nicht messen kannst, kannst du es auch nicht verbessern.

William Thomson, Lord Kelvin

In den letzten 10 Jahren hat sich Site Reliability Engineering in vielen Tech-Unternehmen und in der SysAdmins-Community zu einem anerkannten Begriff entwickelt. In vielen Fällen steht er als Synonym für eine neue, fortschrittliche Art der Verwaltung von Computersystemen, die eng mit Schlagwörtern wie verteilte Systeme und Containerisierung verknüpft ist und eine Reihe von Praktiken darstellt, die es einer Vielzahl von Unternehmen ermöglichen, Systeme in großem Maßstab effizient und kostengünstig zu betreiben und zu unterstützen.

Die grundlegende Eigenschaft, die Site Reliability Engineers (SREs) von traditionellen Systemadministratoren unterscheidet, ist der Blickwinkel. Der herkömmliche Ansatz besteht darin, dafür zu sorgen, dass das System keine Fehler produziert oder überlastet wird. SRE hingegen definiert den gewünschten Systemzustand in Bezug auf die Geschäftsanforderungen.

Beide Ansätze verwenden unzählige Metriken, die den Service aus jedem Blickwinkel überwachen, von der Temperatur einzelner CPU-Kerne bis zu den Stack Traces einer High-Level-Anwendung. Die gleichen Messwerte führen jedoch zu sehr unterschiedlichen Schlussfolgerungen. Aus der Sicht eines SysAdmins ...

Get SRE suchen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.