Kapitel 10. Aus Misserfolgen lernen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Es gibt viele SRE-Praktiken in diesem Buch, aber dies ist die einzige, die ein eigenes Kapitel bekommt. Das Lernen aus Fehlern steht im Mittelpunkt einer aktiven SRE-Praxis, die uns zu dem von uns gewünschten Grad an Zuverlässigkeit führen soll. Um das am besten zu erklären, schauen wir uns die Straßen an, die sich an dieser Kreuzung kreuzen.

Als Erstes hast du die Überwachung/Beobachtbarkeit - die bereits als die wichtigsten Dinge beschrieben wurden, die du zu Beginn deiner Arbeit an der Zuverlässigkeit einrichten musst. Diese Daten geben uns Klarheit über den aktuellen Zustand unserer Systeme, über das , was ist.

Zweitens gibt es Arbeitsplanungsprozesse wie SLIs/SLOs, die es uns ermöglichen, unsere Absichten und Ziele mit einem angemessenen Maß an Klarheit zu spezifizieren, was sein soll.

Und schließlich gibt es noch die Vorfälle/Ausfälle (mit den dazugehörigen Reaktionsmaßnahmen). Sie liefern (ob es uns gefällt oder nicht) Daten darüber, wie das, was ist, von dem , was sein sollte, abweichen kann oder bereits abgewichen ist.

Die Praktiken zum Lernen aus dem Scheitern stehen an diesem Scheideweg. Sie ermöglichen es uns, Rückkopplungsschleifen zu schaffen und zu pflegen, die uns dabei helfen, von dem Punkt, an dem wir sind, zu dem Punkt zu gelangen, an dem wir sein wollen, indem wir die Informationen nutzen, ...

Get SRE werden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.