Teil IV. Management
Unsere letzte Auswahl an Themen befasst sich mit der Zusammenarbeit im Team und der Arbeit als Team. Kein SRE ist eine Insel, und es gibt einige besondere Arten, wie wir arbeiten.
Jede Organisation, die es ernst meint mit einer effektiven SRE-Abteilung, muss über Schulungen nachdenken. Wenn man SREs mit einem gut durchdachten und durchgeführten Schulungsprogramm beibringt, wie sie in einem komplizierten und sich schnell verändernden Umfeld denken sollen, kann man ihnen in den ersten Wochen oder Monaten bewährte Methoden beibringen, auf die sie sonst Monate oder Jahre warten müssten. In Kapitel 28, " SREs schneller in den Bereitschaftsdienst und darüber hinaus", werden wir Strategien für genau das besprechen.
Jeder, der im operativen Geschäft tätig ist, weiß, dass die Verantwortung für einen wichtigen Dienst mit vielen Unterbrechungen einhergeht: Die Produktion gerät in einen schlechten Zustand, Leute fordern Aktualisierungen für ihre Lieblingsbinärdatei an, eine lange Warteschlange von Beratungsanfragen... Das Management von Unterbrechungen unter turbulenten Bedingungen ist eine notwendige Fähigkeit, wie wir in Kapitel 29, Umgang mit Unterbrechungen, besprechen werden.
Wenn die turbulenten Bedingungen lange genug angehalten haben, muss ein SRE-Team beginnen, sich von der betrieblichen Überlastung zu erholen. Wir haben genau den richtigen Flugplan für dich in Kapitel 30, Einbindung eines SRE-Teams zur Überwindung von Betriebsüberlastung.
Get Site Reliability Engineering now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.