Kapitel 34. Fazit

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Ich habe dieses Buch mit großem Stolz durchgelesen. Seit ich in den frühen 90er Jahren bei Excite angefangen habe, wo meine Gruppe eine Art Neandertaler-SRE-Gruppe mit dem Namen "Software Operations" war, habe ich mich durch den Prozess der Systementwicklung getastet. Angesichts meiner Erfahrungen in der Tech-Branche ist es erstaunlich zu sehen, wie die Idee von SRE bei Google Wurzeln schlug und sich so schnell weiterentwickelte. SRE ist von ein paar hundert Ingenieuren, als ich 2006 zu Google kam, auf heute über 1.000 Mitarbeiter angewachsen, die sich auf ein Dutzend Standorte verteilen und die, wie ich finde, interessanteste Computerinfrastruktur der Welt betreiben.

Was hat es der SRE-Organisation bei Google also ermöglicht, sich in den letzten zehn Jahren so zu entwickeln, dass sie diese riesige Infrastruktur auf intelligente, effiziente und skalierbare Weise aufrechterhalten kann? Ich denke, der Schlüssel zum überwältigenden Erfolg von SRE liegt in der Art der Prinzipien, nach denen es arbeitet.

Die SRE-Teams sind so aufgebaut, dass unsere Ingenieure ihre Zeit zwischen zwei gleich wichtigen Aufgaben aufteilen. SREs arbeiten in Bereitschaftsschichten, was bedeutet, dass wir die Systeme in die Hand nehmen, beobachten, wo und wie sie kaputt gehen, und Herausforderungen ...

Get Site Reliability Engineering now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.