Book description
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Große und kleine Unternehmen haben erkannt, wie wichtig die Zuverlässigkeit von Systemen und Anwendungen für ihr Geschäft ist. Sie haben auch gelernt, wie schwierig es ist, diese Zuverlässigkeit aufrechtzuerhalten und gleichzeitig mit der vom Markt geforderten Geschwindigkeit zu iterieren. Site Reliability Engineering (SRE) ist ein bewährter Ansatz zur Bewältigung dieser Herausforderung.
SRE ist ein umfangreiches und vielschichtiges Thema. Google hat mit Site Reliability Engineering, dem sehr erfolgreichen Buch von O'Reilly, das die Entwicklung der Disziplin und die Umsetzung beschreibt, die es Google ermöglicht hat, im Weltmaßstab zu operieren, den Weg bereitet. Inspiriert von diesem Werk, erforscht dieses Buch einen ganz anderen Teil des SRE-Bereichs. Die mehr als zwei Dutzend Kapitel in Seeking SRE bringen dich in einige der wichtigen Gespräche, die in der SRE-Welt gerade geführt werden.
Höre zu, wenn Ingenieure und andere führende Köpfe auf diesem Gebiet diskutieren:
- Unterschiedliche Wege zur Umsetzung von SRE und SRE-Prinzipien in einer Vielzahl von Umgebungen
- Wie sich SRE zu anderen Ansätzen wie DevOps verhält
- Aktuelle Spezialgebiete, die bald zum Alltag von SRE gehören werden
- Bewährte Praktiken und Technologien, die die Arbeit mit SRE erleichtern
- Die wichtige, aber selten erforschte menschliche Seite von SRE
David N. Blank-Edelman ist der Kurator und Herausgeber des Buches.
Table of contents
- Einführung
- I. SRE-Implementierung
- 1. Kontext vs. Kontrolle in SRE
- 2. Befragung von Site Reliability Engineers
- 3. Du willst also ein SRE-Team aufbauen?
-
4. Nutzung von Vorfallmetriken zur Verbesserung von SRE im großen Maßstab
- Der Tugendhafte Kreislauf als Retter: Wenn du es nicht misst...
- Metrics Review: Wenn eine Metrik in den Wald fällt...
- Surrogat-Metriken
- Schulden reparieren
- Virtuelle Reparaturschuld: Den Geist in der Maschine austreiben
- Real-Time Dashboards: Das Brot und die Butter von SRE
- Learnings: TL;DR
- Weitere Lektüre
- 5. Die Zusammenarbeit mit Dritten muss nicht schlecht sein
- 6. Wie man SRE-Prinzipien ohne spezielle SRE-Teams anwendet
-
7. SRE ohne SRE: Die Spotify-Fallstudie
- Tabula Rasa: 2006-2007
- Beta und Veröffentlichung: 2008-2009
- Der Fluch des Erfolgs: 2010
- Haustiere und Rinder, und Agile: 2011
- Ein System, das sich nicht skalieren ließ: 2012
- Einführung der Ops-in-Squads: 2013-2015
- Autonomie vs. Konsistenz: 2015-2017
- Die Zukunft: Geschwindigkeit in großem Maßstab, sicher
- 8. SRE in großen Unternehmen einführen
- 9. Vom SysAdmin zum SRE in 8.963 Wörtern
-
10. Den Weg frei machen für SRE im Unternehmen
- Mühsal, der Feind von SRE
- Die Arbeit im Unternehmen
- Silos, Warteschlangen und Tickets
- Jetzt aktiv werden
- Start by Leaning on Lean
- Beseitige so viele Übergaben wie möglich
- Ersetze verbleibende Übergaben durch Selbstbedienung
- Fehlerbudgets, Arbeitsbeschränkungen und andere Werkzeuge zur Stärkung der Menschen
- Mach mit bei der Bewegung
- 11. SRE-Patterns, die von DevOps-Leuten auf der ganzen Welt geliebt werden
- 12. DevOps und SRE: Stimmen aus der Community
- 13. Produktionstechnik bei Facebook
- II. Near Edge SRE
- 14. Am Anfang war das Chaos
- 15. Der Schnittpunkt von Zuverlässigkeit und Datenschutz
- 16. Datenbank-Zuverlässigkeitstechnik
- 17. Technik für Datenhaltbarkeit
- 18. Einführung in maschinelles Lernen für SRE
- III. Bewährte Methoden und Technologien für SRE
- 19. Do Docs Better: Integration der Dokumentation in den technischen Workflow
- 20. Aktives Lehren und Lernen
- 21. Die Kunst und Wissenschaft der Zielsetzung auf der Dienstleistungsebene
- 22. SRE als Erfolgskultur
-
23. SRE-Antipatterns
- Antipattern 1: Zuverlässigkeit der Website
- Antipattern 2: Menschen starren auf Bildschirme
- Antipattern 3: Reaktion auf Mobbingvorfälle
- Antipattern 4: Grundursache = Menschliches Versagen
- Antipattern 5: Den Pager weitergeben
- Antipattern 6: Magisches Rauchspringen!
- Antipattern 7: Alert Reliability Engineering
- Antipattern 8: Einen Hundespaziergänger für deine Haustiere engagieren
- Antipattern 9: Speed-Bump Engineering
- Antipattern 10: Design Chokepoints
- Antimuster 11: Zu viel Peitsche, zu wenig Zuckerbrot
- Antipattern 12: Aufschieben der Produktion
- Antipattern 13: Optimierung der Fehlervermeidung statt der Wiederherstellungszeit (MTTF > MTTR)
- Antipattern 14: Abhängigkeitshölle
- Antipattern 15: Ungünstige Governance
- Antipattern 16: Unüberlegte SLOh-Ohs
- Antipattern 17: Deine API über die Firewall schieben
- Antipattern 18: Das Ops-Team reparieren
- Das war's dann also?
-
24. Unveränderliche Infrastruktur und SRE
- Skalierbarkeit, Verlässlichkeit und Leistung
- Wiederherstellung bei Ausfall
- Einfacher Betrieb
- Schnellere Startup-Zeiten
- Bekannter Staat
- Kontinuierliche Integration/kontinuierliches Deployment mit Zuversicht
- Sicherheit
- Multiregionale Operationen
- Technik freigeben
- Erstellung des Basisbildes
- Einsatz von Anwendungen
- Benachteiligungen
- Fazit
- 25. Skriptfähige Load Balancer
- 26. Der Service Mesh: Wrangler für deine Microservices?
- IV. Die menschliche Seite von SRE
- 27. Psychologische Sicherheit in SRE
- 28. SRE Kognitive Arbeit
- 29. Jenseits von Burnout
- 30. Gegen den Bereitschaftsdienst: Eine Polemik
- 31. Elegie für komplexe Systeme
- 32. Überschneidungen zwischen Betrieb und sozialem Aktivismus
- 33. Fazit
- Index
Product information
- Title: SRE suchen
- Author(s):
- Release date: October 2024
- Publisher(s): O'Reilly Media, Inc.
- ISBN: 9798341604155
You might also like
article
Reinventing the Organization for GenAI and LLMs
Previous technology breakthroughs did not upend organizational structure, but generative AI and LLMs will. We now …
article
Three Ways to Sell Value in B2B Markets
As customers face pressure to reduce costs while maintaining profitability, value-based selling (VBS) has become critical …
article
Run Llama-2 Models Locally with llama.cpp
Llama is Meta’s answer to the growing demand for LLMs. Unlike its well-known technological relative, ChatGPT, …
audiobook
The Year in Tech, 2025
<B>A year of HBR's essential thinking on tech—all in one place.</B><br/><br/><br/><br/>Generative AI, biometrics, spatial computing, electric …