Kapitel 9. Reaktion auf Vorfälle
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Jeder möchte, dass seine Dienste immer reibungslos funktionieren, aber wir leben in einer unvollkommenen Welt, in der es immer wieder zu Ausfällen kommt. Was passiert, wenn ein nicht ganz so gewöhnliches, dringendes Problem mehrere Personen oder Teams erfordert, um es zu lösen? Plötzlich bist du damit konfrontiert, gleichzeitig die Reaktion auf den Vorfall zu managen und das Problem zu lösen.
Einen Vorfall zu beheben bedeutet, die Auswirkungen zu mildern und/oder den vorherigen Zustand wiederherzustellen. Einen Vorfall zu managen bedeutet, die Bemühungen der Einsatzteams effizient zu koordinieren und sicherzustellen, dass die Kommunikation sowohl zwischen den Einsatzkräften als auch mit denjenigen, die sich für den Fortschritt des Vorfalls interessieren, funktioniert. Viele Tech-Unternehmen, darunter auch Google, haben die bewährten Methoden für die Bewältigung von Vorfällen von Notfallorganisationen übernommen und angepasst, die diese Methoden schon seit vielen Jahren anwenden.
Der Grundgedanke des Vorfallsmanagements ist es, auf einen Vorfall strukturiert zu reagieren. Großereignisse können verwirrend sein; eine Struktur, auf die sich die Teams im Voraus einigen, kann das Chaos verringern. Wenn du Regeln ...
Get Das Arbeitsbuch zur Standortzuverlässigkeit now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.