KAPITEL 14

Telemetriedaten erzeugen, um Probleme zu erkennen und zu beheben

In Operations lässt es sich nicht verhindern, dass Dinge schiefgehen – kleine Änderungen führen eventuell zu vielen unerwarteten Ergebnissen, Ausfällen oder gar globalen Fehlern, die alle Kunden betreffen. Das ist die Realität bei der Betreuung komplexer Systeme – niemand kann das System im Ganzen überblicken und verstehen, wie alle Teile zusammenpassen.

Treten bei unserer täglichen Arbeit Produktivausfälle oder andere Probleme auf, fehlen uns häufig die Informationen, die wir zum Lösen des Problems brauchen. So können wir zum Beispiel bei einem Ausfall nicht herausfinden, ob das Problem durch einen Fehler in der Anwendung (zum Beispiel einen Fehler im Code), in der Umgebung ...

Get Das DevOps-Handbuch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.