Vorwort
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Gibt es in deinem Unternehmen IT-Vorfälle?
Hattest du schon einmal einen schwerwiegenden IT-Vorfall, der den Service, den deine Kunden von dir erwarten, gestört hat?
Hat dieser Vorfall den Ruf deines Unternehmens geschädigt, das Vertrauen deiner Kunden oder Investoren untergraben oder negative geschäftliche oder finanzielle Auswirkungen verursacht?
War die Reaktion auf den Vorfall und seine Lösung langsam, unorganisiert oder schlecht verwaltet?
Wenn du eine dieser Fragen mit "Ja" beantwortet hast, solltest du dir noch eine weitere Frage stellen: Bist du damit zufrieden, wie dein Unternehmen derzeit auf IT-Vorfälle reagiert? Wenn die Antwort "Nein" lautet, dann musst du nach einem besseren Weg suchen, und dieses Buch wurde für dich geschrieben.
Wir zeigen dir einen neuen Weg, wie du auf IT-Vorfälle reagierst und sie löst. Dieser neue Weg funktioniert in kleinen DevOps-Teams bis hin zu den größten Unternehmen und Dienstleistern. Gemeinsam verfügen wir über mehr als 100 Jahre Erfahrung in der Leitung von Sondereinsatzteams bei städtischen Feuerwehren an der Ost- und Westküste und im Management kritischer Infrastrukturen in den Vereinigten Staaten. Darüber hinaus haben wir in mehr als 40 Ländern auf höchster Regierungs- und Industrieebene Erfahrungen mit der Leitung von Sondereinsätzen gesammelt. In diesem Buch stellen wir die bewährten Methoden außerhalb der IT-Branche vor, die sich im wahrsten Sinne des Wortes in der Feuerprobe bewährt haben, und wenden dieselben Methoden für die Reaktion auf Zwischenfälle auf die Welt des IT-Betriebs an.
Wie und warum haben wir den Sprung von der Feuerwehr zur IT geschafft? Im Herbst 2012 trafen wir uns auf Vorschlag von mit Jesse Robbins (siehe Vorwort), dem ursprünglichen Befürworter des Einsatzes von IMS-Taktiken und -Strategien in der IT, mit einer ausgewählten Gruppe von IT-Fachleuten, die bei großen Social-Media-Unternehmen und anderen großen Webunternehmen für die Betriebszeit verantwortlich waren. Ziel des Treffens war es, die Herausforderungen zu diskutieren und besser zu verstehen, mit denen IT-Unternehmen bei der Lösung von IT-Störungen konfrontiert sind. Diese IT-Experten wollten außerhalb ihrer Branche nach einem besseren Weg suchen, weil die Modelle innerhalb der IT-Branche nicht gut funktionierten. Sie wollten erfahren, wie die Feuerwehr mit zeitkritischen Vorfällen umgeht, bei denen viel auf dem Spiel steht, die Entscheidungsgrundlage schlecht ist, sich die Bedingungen ändern und der Ausgang ungewiss ist.
Im Laufe der Diskussion erkannte die Gruppe die verblüffenden Ähnlichkeiten zwischen dringenden Vorfällen im Bereich der öffentlichen Sicherheit, die eine Reaktion der Feuerwehr erfordern, und dringenden technologischen Vorfällen, die eine Reaktion der IT erfordern. Tatsächlich sind die ersten IT-Mitarbeiter, die auf eine Dienstunterbrechung oder einen Cybersecurity-Angriff reagieren, die "Ersthelfer", genau wie die ersten Feuerwehrleute am Ort des Geschehens. Am Ende des Treffens waren wir uns alle einig, dass es viele Möglichkeiten gibt, die besten Elemente des IMS für die öffentliche Sicherheit, vor allem in Bezug auf die Führung von Mitarbeitern und das Zeitmanagement, direkt auf die IT-Branche zu übertragen. Die Prinzipien sind die gleichen und lassen sich direkt auf die Art von schweren/prioritären Vorfällen in der IT-Branche anwenden.
"Vor ein paar Jahren suchten wir nach einem besseren Weg, um Vorfälle bei Salesforce zu managen", sagt Kwesi Ames, VP of Site Reliability Engineering bei dem Unternehmen. "Indem wir die Prinzipien von IMS, dem gleichen System, das auch von der Feuerwehr verwendet wird, adaptierten, konnten wir eine enorme Verbesserung bei der Reaktion auf kritische technologische Vorfälle feststellen. Das war ein echter Wendepunkt für uns", betonte er. "Wir erhielten eine disziplinierte Vorlage, die es uns ermöglichte, bei größeren Problemen in unserer Produktionsumgebung durchgehend effizient zu reagieren und zu handeln. Das hat zu schnelleren Wiederherstellungszeiten geführt und den Vertrauensverlust bei den Kunden minimiert."
Das IMS legt den Rahmen für die Reaktion auf Vorfälle und die Verhaltensnormen für die Incident Responder fest. Ereignisse mit hohem Schweregrad/Priorität setzen die Incident Responder unter kritischen Zeitdruck, um IT-Vorfälle zu lösen, wenn das Vertrauen der Kunden, negative finanzielle Auswirkungen und der Ruf des Unternehmens auf dem Spiel stehen. Der Einsatz von IMS erhöht die Chancen auf ein gutes Ergebnis und den Schutz der Geschäfte des Unternehmens.
Es ist eine Tatsache, dass die Zukunft der Datenverarbeitung mehr Umfang, mehr Komplexität und sicherlich auch mehr Veränderung verspricht - und das alles in immer größerer Geschwindigkeit. Es stimmt auch, dass die Wahrscheinlichkeit, dass in deinem Unternehmen ein größeres technologisches Problem auftritt, das intern oder extern verursacht wird, jeden Tag steigt.
Ohne eine vorhersehbare Art und Weise, auf Vorfälle zu reagieren, ist jedes Unternehmen - egal ob es wächst oder reif ist - gefährdet. Torsten Rueter, Global Platform Services Leader bei GE Capital, sieht das so: "Rahmenwerke wie ITIL haben dazu beigetragen, den IT-Betrieb in großem Maßstab zu reifen. Das Incident Management System befasst sich mit einigen der subtileren - aber äußerst wichtigen - Aspekten des Managements von Vorfällen. Ohne eine starke Führung, Zusammenarbeit und gemeinsame Arbeitsmuster wird ein Incident Response Team sein volles Potenzial nicht ausschöpfen können.
Aufbauend auf der Arbeit von Jesse Robbin haben wir das Incident Management System (IMS) von der öffentlichen Sicherheit auf die IT-Umgebung von Unternehmen übertragen. Wir binden das IMS in ITIL, DevOps, Agile und Lean Praktiken ein. Wir arbeiten mit unseren Kunden zusammen, um eine Kultur der Incident Response aufzubauen.
Wir haben einen einzigartigen Blickwinkel auf die IT-Branche. Gemeinsam bringen wir mehr als 100 Jahre Erfahrung im Bereich Feuerwehr und kritische Infrastrukturen in das IT-Einsatzmanagement ein. Wir kombinieren unsere umfassende globale Erfahrung in den Bereichen Brandbekämpfung, Gefahrgut (HazMat), Massenvernichtungswaffen (WMD) und Terrorismusbekämpfung mit Glasfasernetzen, Rechenzentren, Öl und Gas, Energie und Kapitalmärkten, um die Leistung des Störungsmanagements zu verbessern.
Unsere Kunden erwirtschaften einen Umsatz von 400 Milliarden US-Dollar und eine Marktkapitalisierung von 1 Billion US-Dollar und beschäftigen weltweit über 850.000 Menschen. Diese Unternehmen gehören zu den Top 10% der Fortune 500 und der PwC Global 100 Software Leaders. Sie sind weltweit in den Bereichen Industrie, Finanzdienstleistungen, Konsumgüter, Telekommunikation und Software tätig und bedienen Märkte in Nordamerika, Europa, dem Nahen Osten, Afrika, Asien und dem Pazifik.
Beurteilung, Schulung, Bewertung und Übungen sind der beste Indikator für zukünftige Leistungen. Wir haben unsere Incident Management Programme auf drei Kontinenten und in neun Ländern für Tausende von Incident Commanders (IC), Fachexperten (SME), Führungskräften und Unternehmensmitarbeitern durchgeführt. Sie arbeiten in den Bereichen Standortzuverlässigkeit, Cybersicherheit, missionskritische Unterstützung, einheitliches Kommando, Unternehmens-IT, Betrieb, F&E und Technik (Netzwerk, Datenbank, SAN/Speicherung, Server, Automatisierung, Anwendungen), Rechtswesen, Krisenkommunikation und Managementteams. Diese Teams arbeiten in globalen Kommandozentralen, Notfalleinsatzzentralen, regionalen Einsatzzentralen, War Rooms und Vorstandsetagen einiger der größten Unternehmen mit den größten Technologiepaketen der Welt. Wir maximieren die Betriebszeit bei schwerwiegenden IT-Vorfällen.
Dieses Buch zeigt dir eine bewährte Methode für das Incident Management in der IT-Branche, auch wenn sie nicht aus der IT-Branche stammt. Wir bieten dir nicht nur eine bessere Denkweise für die Reaktion auf Vorfälle, sondern auch einen Einblick in die kampferprobten IMS-Techniken, die in anderen IT-Organisationen und bei der Feuerwehr der Vereinigten Staaten eingesetzt werden, um Situationen, in denen es um Leben und Tod geht, zu organisieren, zu leiten und zu lösen. Wir werden die gleichen Überlegungen, Perspektiven und Ratschläge anbieten, die einem Fortune 50 Finanzdienstleistungsunternehmen geholfen haben, seine Mean Time To Repair (MTTR) um 35% zu senken. Außerdem werden wir Anwendungsfälle diskutieren, die für einige der größten (und einige der kleinsten) IT-Betriebsteams der Welt repräsentativ sind.
Es gibt einen besseren Weg, auf Vorfälle zu reagieren, und du hast ihn gerade gefunden.
In diesem Buch verwendete Konventionen
In diesem Buch werden die folgenden typografischen Konventionen verwendet:
- Kursiv
-
Weist auf neue Begriffe, URLs, E-Mail-Adressen, Dateinamen und Dateierweiterungen hin.
O'Reilly Safari
Hinweis
Safari (ehemals Safari Books Online) ist eine mitgliedschaftsbasierte Schulungs- und Nachschlageplattform für Unternehmen, Behörden, Lehrkräfte und Einzelpersonen.
Mitglieder haben Zugang zu Tausenden von Büchern, Schulungsvideos, Lernpfaden, interaktiven Tutorials und kuratierten Playlists von über 250 Verlagen, darunter O'Reilly Media, Harvard Business Review, Prentice Hall Professional, Addison-Wesley Professional, Microsoft Press, Sams, Que, Peachpit Press, Adobe, Focal Press, Cisco Press, John Wiley & Sons, Syngress, Morgan Kaufmann, IBM Redbooks, Packt, Adobe Press, FT Press, Apress, Manning, New Riders, McGraw-Hill, Jones & Bartlett und Course Technology, um nur einige zu nennen.
Weitere Informationen erhältst du unter http://oreilly.com/safari.
Wie du uns kontaktierst
Bitte richte Kommentare und Fragen zu diesem Buch an den Verlag:
- O'Reilly Media, Inc.
- 1005 Gravenstein Highway Nord
- Sebastopol, CA 95472
- 800-998-9938 (in den Vereinigten Staaten oder Kanada)
- 707-829-0515 (international oder lokal)
- 707-829-0104 (Fax)
Wenn du Kommentare oder technische Fragen zu diesem Buch stellen möchtest, sende eine E-Mail an bookquestions@oreilly.com.
Weitere Informationen zu unseren Büchern, Kursen, Konferenzen und Neuigkeiten findest du auf unserer Website unter http://www.oreilly.com.
Finde uns auf Facebook: http://facebook.com/oreilly
Folge uns auf Twitter: http://twitter.com/oreillymedia
Schau uns auf YouTube: http://www.youtube.com/oreillymedia
Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter http://shop.oreilly.com/product/0636920036159.do aufrufen.
Danksagungen
Die Autoren möchten sich bei den Mitarbeitern von O'Reilly Media für ihre Unterstützung und Hilfe bedanken, insbesondere bei Brian Anderson, der uns durch den Prozess geführt hat. Außerdem möchten die Autoren Jesse Robbins danken, der den Weitblick und die Vision hatte, die IMS-Konzepte in die IT-Welt zu bringen. Er ist nicht nur ein wunderbarer Freund, sondern hat uns auch mit Rat und Tat zur Seite gestanden, wofür wir ihm sehr dankbar sind. Eine weitere Person, die bei der Entwicklung dieses Textes von unschätzbarem Wert war, war Andrea Walter, die die erste Bearbeitung und Formatierung vorgenommen hat. Sie hatte die schwierige Aufgabe, unsere Gedanken in diesen Text zu packen. Tom Welch, ein Feuerwehrkommandant aus der San Francisco Bay Area, hat den Text mit Einblicken und Kommentaren zum Inhalt aus der Perspektive der Feuerwehr bereichert. Wir möchten uns auch bei unseren Gutachtern bedanken, die uns bei der Verbesserung des Textes unterstützt haben: Jason Hand und John Allspaw. Ashley und Amber Vidal haben mit ihren Korrekturen und ihrem ehrlichen Feedback dazu beigetragen, den Text zu straffen und unsere Punkte in einfachem Englisch zu erklären. Unser Dank gilt auch unseren Kunden und den Tausenden von IT-Respondern, die wir geschult haben und mit denen wir auf der ganzen Welt zusammenarbeiten. Sie haben genauso viel dazu beigetragen wie wir, indem sie ihre Erfahrungen, Herausforderungen und Erfolge in dieses Buch einfließen ließen.
Get Störfallmanagement für Einsätze now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.