Kapitel 16. Überwachung und präventive Unterstützung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Wenn du bis hierher gelesen hast, musst du wirklich darauf aus sein, alle mit einem System zu beeindrucken, das nicht nur skalierbar und zuverlässig, sondern auch hoch verfügbar ist. Mit den richtigen Werkzeugen und der richtigen Herangehensweise sind die fünf Neunen, die früher für Telekommunikationssysteme reserviert waren, jetzt auch in jedem anderen Bereich, für den du Software entwickelst, leicht zu erreichen. Aber es reicht nicht aus, alles zu implementieren, was in den vorherigen Kapiteln beschrieben wurde. Genauso wichtig wie robuste Software, redundante Hardware, Netzwerke, Stromversorgungen und mehrere Rechenzentren ist es, dass du ein hohes Maß an Transparenz über die Vorgänge in deinem System erreichst und in der Lage bist, die gesammelten Informationen zu nutzen.

Dein DevOps-Team wird all diese Informationen für zwei Zwecke nutzen: präventive Unterstützung und postmortem Debugging. Durch die Überwachung des Systems können sie Frühwarnzeichen erkennen und Probleme beheben, bevor sie außer Kontrolle geraten, entweder manuell oder durch Automatisierung. Ist deine Festplatte überfüllt? Löst ein Skript aus, das alte Logs löscht und so für Ordnung sorgt. Ist deine Last in den letzten Monaten durch eine Zunahme der registrierten Nutzer und gleichzeitigen Sitzungen stetig gestiegen? Setze mehr ...

Get Design für Skalierbarkeit mit Erlang/OTP now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.