Einführung in die moderne Systemverwaltung

Systeme bestehen aus einer Gruppe von Komponenten und deren Beziehungen zueinander, die ein komplexes Ganzes bilden. Im Grunde versuchst du, dich in diesem Chaos zurechtzufinden, um deine Systeme nachhaltig zu verwalten. Es gibt nicht den einen richtigen Weg des Systemmanagements, aber es gibt Wege, die du auf deiner Reise zum Verständnis deiner Systeme einschlagen kannst, um ihre physische und psychische Belastung zu verringern und eine lebenslange Karriere mit interessanten Herausforderungen aufzubauen.

Ich habe dieses Buch so aufgebaut, dass es dir die Ressourcen bietet, die du brauchst, um dich auf deine Reise zur Einführung moderner Systemadministrationstechnologien, -werkzeuge und -praktiken vorzubereiten. In dieser Einführung gebe ich dir einige übergeordnete Ziele vor, die dir helfen werden, deinen eigenen Weg zu finden, um deine Systeme zuverlässig und nachhaltig zu betreuen.

Karte deiner Reise

In vielerlei Hinsicht sind Systemadministratoren wie Wanderer, die sich in die Wildnis aufmachen. Wie Abbildung I-1 zeigt, glauben wir, dass es irgendwo da draußen eine Karte gibt, die uns genau sagt, was wir wann zu tun haben, und dass wir, wenn wir dieser Karte folgen, ein perfekt gewartetes System erhalten werden. Wir stellen uns vor, dass der Weg, den wir gehen werden, gut beleuchtet ist und dass die Karte, die wir finden, klar definierte Meilensteine und Ziele hat.

Die moderne Systemadministration ähnelt jedoch eher Abbildung I-2. Du kannst dich mit einigen universellen Werkzeugen auf die Reise vorbereiten: die grundlegenden und kritischen Praktiken für den Aufbau, die Überwachung und die Skalierung jedes Systems. Du kannst nicht vorhersagen, welche Werkzeuge du auf deiner Reise brauchen wirst oder wie du sie einsetzen musst, aber du wirst bereit sein, diese Entscheidungen zu treffen und sie umzusetzen, wenn die Zeit gekommen ist. Und du musst es nicht allein tun!

msad i001
Abbildung I-1. Dieses Bild zeigt, was die meisten von uns für möglich halten - eine klare Karte mit klaren Zielen und eine einsame Reise - wenn wir nur die richtigen Ressourcen finden und die richtigen Dinge lernen. Das ist nicht die Realität (Bild von Tomomi Imura).

Du musst deinen Weg zu einer effektiven Systemadministration in jeder Organisation und in jedem Team, dem du beitrittst, individuell gestalten. Letztendlich werden die Meilensteine und Ziele unterschiedlich sein.

Beim Wandern kennst du nicht jede einzelne Abzweigung auf dem Weg. Selbst wenn du denselben Weg schon gegangen bist, kannst du auf neue Herausforderungen stoßen: ein ausgewaschener Pfad oder wilde Tiere, die du nicht stören willst. Bei der Systemadministration wirst du auf unerwartete Probleme (Wendungen) stoßen, die sich auf das Ergebnis deiner Bemühungen auswirken. Also lernst du aus deinen Fehlern, probierst andere Wege aus, bittest um Hilfe und versuchst es weiter, bis du dein Ziel erreichst.

msad i002
Abbildung I-2. Es gibt nicht die eine Ressource, die uns genau sagt, was wir tun müssen, um unsere Systeme zu verwalten. Der Weg, der vor uns liegt, ist unklar und das Terrain stimmt nie mit der Karte überein, aber mit den richtigen Werkzeugen und Mitarbeitern können wir mit Zuversicht voranschreiten, dass wir in der Lage sein werden, alles zu bewältigen, was vor uns liegt (Bild von Tomomi Imura).

Dieses Buch unterstützt dich dabei, Muster und Verhaltensweisen zu entwickeln, mit denen du deine Zeit und Energie dorthin lenkst, wo sie gebraucht werden, damit du hochwertige, zuverlässige und nachhaltige Systeme aufbauen kannst. Die Größe und der Umfang deiner Aufgaben werden variieren. Vielleicht bist du für alles verantwortlich und musst ein Gleichgewicht zwischen der Unterstützung der gesamten Organisation und bestimmten technischen Initiativen finden. Vielleicht verwaltest du die "IT-Infrastruktur" und die Art und Weise, wie das Unternehmen seine Geschäfte führt. Du kannst die spezifische Infrastruktur für ein bestimmtes Produkt betreuen.

Wenn etwas schief geht, musst du deine Systeme aufrechterhalten, ohne deine eigene körperliche und geistige Gesundheit zu schädigen. Du bist nicht fertig, wenn du dein Ziel erreicht hast. Ein Leben lang wirst du dich immer wieder auf neue Wege und Gebiete einstellen müssen, da sich die Technik und die Verfahren weiterentwickeln.

Verändere deine Denkweise

Die Vorbereitung beginnt mit einer Wachstumsmentalität, bei der du daran glaubst, dass du deine Fähigkeiten und Talente mit der Zeit ausbauen kannst. Du kannst deine Fähigkeiten und dein Wissen ständig aktualisieren und dich Herausforderungen und Misserfolgen stellen.

In diesem Buch stelle ich dir verschiedene Modelle vor, mit denen du über die Systeme, die du verwaltest, nachdenken kannst. Modelle ermöglichen Verständnis und Kommunikation und helfen dabei, Konzepte zu erklären, Ideen darzustellen und gemeinsame Wege zu finden, um miteinander zu sprechen. Kein Modell ist fehlerfrei. Das sollen sie auch gar nicht sein. Wenn du über die Systeme nachdenkst, die die Modelle repräsentieren, erinnere dich an den Satz von Vincent van Gogh: "[D]as Modell ist nicht dein letztes Ziel.1 und sei vorsichtig, wenn das Modell dir keinen guten Rahmen bietet, um deine Systeme zu erhalten.

Nutze Modelle wie Infrastructure as Code und das Fünf-Schichten-Modell des Internets, um deine Systeme zu verarbeiten, zu visualisieren und zu erklären. Und baue auf deinen Erfahrungen auf, um neue Modelle zu entwickeln, die die Praktiken und Technologien in der Systemverwaltung voranbringen.

Das Herzstück der modernen Systemadministration ist die Tatsache, dass deine Systeme immer komplexer und größer werden, da "Software die Welt frisst". Um effektiv arbeiten zu können, musst du den Wandel erkennen und dein Verständnis dafür entwickeln, was es bedeutet, die Arbeit in der Praxis zu erledigen, sei es durch die Einführung neuer Praktiken oder Technologien.

Was ist der Auftrag?

Du bist für den Aufbau, die Konfiguration und die Wartung zuverlässiger und nachhaltiger Systeme verantwortlich, wobei es sich bei Systemen um bestimmte Tools, Anwendungen oder Dienste handeln kann. Zwar sollte sich jeder im Unternehmen um Betriebszeit, Leistung und Sicherheit kümmern, aber deine Perspektive konzentriert sich auf diese Messungen im Rahmen des Budgets des Unternehmens oder Teams und der spezifischen Anforderungen des Tools, der Anwendung oder des Dienstes.

Egal, ob du Hunderte oder Tausende von Systemen verwaltest, du bist ein Systemadministrator, wenn du erhöhte Berechtigungen auf dem System hast. Leider versuchen viele Menschen, die Systemadministration über die Aufgaben oder die Arbeit zu definieren, die eine Person verrichtet. Das liegt oft daran, dass die Rolle nicht gut definiert ist und meist eine übergroße Verantwortung für alles übernimmt, was sonst niemand machen will.

Viele beschreiben die Systemadministration als die Rolle des digitalen Hausmeisters,2 Sie ist dafür verantwortlich, die Systeme aufzuräumen, vor allem wenn sie nicht wie gewünscht funktionieren. Auch wenn die Rolle des Hausmeisters in einem Unternehmen wichtig ist, erweist man beiden Positionen mit dieser Gleichsetzung einen Bärendienst.

Engere Entsprechungen für Systemadministratoren sind Klempner, Elektriker oder HLK-Spezialisten. Die Menschen halten es für selbstverständlich, dass moderne Häuser und Unternehmen über fließendes Wasser, Strom und Klimaanlagen verfügen, aber diese Systeme müssen von ausgebildeten Fachleuten gebaut, installiert, gewartet und repariert werden, damit sie richtig und sicher funktionieren.

Geschmacksrichtungen der Systemverwaltung

Die Bezeichnung für die Personen, die Systeme verwalten, ist sehr unterschiedlich (z.B. Sysadmin, SRE,3 DevOps Engineer, Platform Engineer und Cloud Engineer, um nur einige zu nennen). Der Name der Rolle kann darauf hinweisen, dass etwas andere Fähigkeiten erforderlich sind. Bei "SRE" zum Beispiel wird oft erwartet, dass die Ingenieure auch Softwareentwickler mit Kenntnissen in der Betriebsführung sind. Bei DevOps-Ingenieuren wird oft davon ausgegangen, dass sie mindestens eine moderne Sprache beherrschen und über Kenntnisse in kontinuierlicher Integration und Bereitstellung verfügen. Meistens ist es nur ein Name und nicht immer ein einheitlicher. Manchmal definiert ein Team die Rolle ganz anders und verlangt je nach den Bedürfnissen der Organisation bestimmte Fähigkeiten. Um zu vermeiden, dass die Erwartungen nicht übereinstimmen, solltest du dich direkt an das Team wenden, wenn du herausfinden willst, ob eine Rolle gut zu dir passt. Das Akronym SRE kann zum Beispiel in verschiedenen Organisationen für Site, System, Service Reliability oder Resilience Engineering stehen.

Als Ingenieursdisziplin ist die Systemadministration teils Kunst, teils Wissenschaft. Es ist eine Herangehensweise an deine Arbeit (das Entwerfen, Bauen und Überwachen deiner Systeme), die die Auswirkungen auf die Sicherheit, die menschlichen Faktoren, die gesetzlichen Vorschriften, die Praktikabilität und die Kosten berücksichtigt. Es kann Hunderte von verschiedenen Wegen geben, etwas zu erreichen. Dein Wissen, deine Fähigkeiten und deine Erfahrungen entscheiden darüber, welchen der vielen Wege du wählst, während du deine analytischen Fähigkeiten einsetzt, um die Auswirkungen und den Erfolg zu überwachen, um zu erkennen, wann du Geld oder Zeit ausgeben (oder sparen) solltest und um die Kosten für die Menschen zu berücksichtigen, die das System unterstützen.

Sich entwickelnde Praktiken annehmen

So wie sich die Technologie weiterentwickelt, haben sich auch die Praktiken zur Verwaltung der Technologien angepasst. Sei darauf vorbereitet, neue Techniken zu übernehmen, um mit den sich ändernden Plattformen Schritt zu halten und die Auswirkungen eines Systems zu verringern und es wartbar zu machen.

Die grundlegende Dynamik zwischen Systemadministratoren und Entwicklern ändert sich, wenn du die Zuverlässigkeit deines Systems misst und die Organisation die Verantwortung für die Verbesserung der Zuverlässigkeit wechselt. Heutzutage ist es üblicher, dass alle an der Verbesserung der Zuverlässigkeit eines Produkts mitwirken, als dass ein einzelnes Team die Hauptlast der Supportarbeit trägt, um ein System oder einen Dienst am Laufen zu halten. SRE-Teams sind in der Lage, den Gesamtaufwand für die Systeme zu reduzieren.4

Zusammenarbeit begrüßen

Das Tempo des Wandels, die Komplexität unserer Umwelt und die Risiken, die mit ihrem Scheitern verbunden sind, erfordern folgende Maßnahmen:

  • Zusammenführung von Fachwissen aus verschiedenen Bereichen (z. B. Entwicklung, Betrieb, Sicherheit und Tests)

  • Vorschläge integrieren, statt Kompromisse zu schließen, damit die endgültige Lösung mehrere Perspektiven berücksichtigt

Es braucht echte Anstrengungen, um das Vertrauen und die psychologische Sicherheit aufzubauen, die Menschen dazu ermutigt, ihre Meinungen und Perspektiven zu äußern. Wenn die Teammitglieder psychologische Sicherheit untereinander erreicht haben, fühlen sie sich sicher, Risiken einzugehen und verletzlich zu sein. Ein Teammitglied, das ein hohes Maß an psychologischer Sicherheit verspürt, wird zum Beispiel proaktiv mitteilen, wenn es Hilfe braucht. Dies kann dazu beitragen, Fehler im System zu verhindern, da ein System der gegenseitigen Unterstützung aufgebaut wurde.

Fördern Sie eine Kultur, die es den Menschen ermöglicht und sie dabei unterstützt, bohrende Fragen zu stellen, damit alle zu einem gemeinsamen Verständnis kommen (wir arbeiten auf das gleiche Ziel hin) und den intellektuellen Mut fördern (Experten sind fehlbar). Einige Fragen sind zum Beispiel die folgenden:

  • Warum? Warum tun wir das? Warum funktioniert es auf diese Weise?

  • Kannst du mir helfen, deine Perspektive zu verstehen?

  • Welche anderen Möglichkeiten hast du dir überlegt, um das Problem zu lösen?

Tipp

Erfahre mehr über psychologische Sicherheit, die wichtigste Dynamik für leistungsstarke Teams, die Googles People Operations in seiner Forschung mit dem re:Work-Programm identifiziert hat.

Die Zusammenarbeit mit anderen führt dazu, dass du gut mit ihnen zusammenarbeitest. Wenn du sie am dringendsten brauchst, sind deine Mitarbeiter/innen verfügbar (und bereit), dich zu unterstützen, weil du dich bereits auf diese Eventualität vorbereitet hast.

Umarmung der Nachhaltigkeit

Nachhaltigkeit ist das Maß für ein System, das es den Menschen in diesem System ermöglicht, ein gesundes Leben zu führen, während sie arbeiten. Unabhängig von der Größe und dem Umfang deiner Arbeit bestimmen acht Maßnahmen die Nachhaltigkeit deiner Arbeit:

Leistung

Misst die Fähigkeit des Systems, über einen bestimmten Zeitraum hinweg nützliche Arbeit zu leisten. Die Systemleistung wird je nach Dienstleistung oder Produkt, das du herstellst, unterschiedlich definiert.

Skalierbarkeit

Misst die Anpassungsfähigkeit des Systems beim Hinzufügen und Entfernen einzelner Komponenten.

Verfügbarkeit

Misst die Zeitspanne, in der das System wie erwartet funktioniert.

Verlässlichkeit

Misst, wie gut ein System seinen spezifischen Zweck über einen bestimmten Zeitraum hinweg erfüllt.

Instandhaltbarkeit

Misst, wie einfach es ist, ein System zu implementieren, zu aktualisieren und abzuschaffen.

Einfachheit

Misst die Leichtigkeit, mit der ein neuer Ingenieur das System versteht.

Benutzerfreundlichkeit

Misst die Zufriedenheit der Nutzer mit dem System.

Beobachtbarkeit

Misst, wie gut du herausfinden kannst, was in einem beobachteten System schief läuft, wobei nicht alle Systeme ein hohes Maß an Beobachtbarkeit benötigen.

In den folgenden Kapiteln stelle ich dir verschiedene Technologien und Praktiken vor, mit denen du die Ziele, die du dir für diese Maßnahmen gesetzt hast, und letztlich auch die Nachhaltigkeit deiner Systeme verbessern kannst.

Einpacken

Deine Reise wird spezifisch für deine Systeme und die Menschen, die diese Systeme unterstützen, sein. Niemand kann dir eine perfekt definierte Checkliste geben, die dir genau sagt, was du wann lernen oder tun musst. Dennoch kannst du dich mit dem richtigen Werkzeug (Verständnis der Grundlagen und Schlüsselpraktiken sowie Aufbau, Überwachung und Skalierung der Systeme) besser vorbereiten.

Der Beruf des Systemadministrators entwickelt sich ständig weiter. Daher wäre es hilfreich, eine wachstumsorientierte Haltung einzunehmen und die Talente und Fähigkeiten zu fördern, die notwendig sind, um ein Leben lang mit neuen Technologien und Praktiken arbeiten zu können.

Bitte um Hilfe und baue auf kollaborative Praktiken, die es dir ermöglichen, effektiv mit deinem Team zu arbeiten, indem du psychologische Sicherheit aufbaust. Nutze Modelle, um dein Verständnis zu verbessern, und baue darauf auf, um die Systemadministration voranzutreiben.

Mach dir die Nachhaltigkeit zu eigen. Du verdienst es, dich zu entfalten und eine ganze Karriere zu haben, die die Systeme unterstützt, die du verwaltest.

1 Vincent van Gogh zitiert Dickens: "[D]as Modell ist nicht dein letztes Ziel, sondern das Mittel, um deinen Gedanken und deiner Inspiration Form und Kraft zu geben" , in einem Brief an seinen Bruder.

2 Schau dir die vielen Rollen von Systemadministratoren in Anhang B des Buches The Practice of System and Network Administration (Addison-Wesley Professional) von Thomas Limoncelli et al. an.

3 Erfahre mehr über den Beruf des SRE in Alice Goldfuss' Blogbeitrag "How to Get into SRE" und Molly Struves Blogbeitrag "What It Means to Be a Site Reliability Engineer".

4 In Stephen Thornes Medium-Artikel über die Grundsätze von SRE erfährst du mehr über die Reduzierung von Arbeit und ihre Auswirkungen auf Teams.

Get Modern System Administration now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.