Vorwort

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Als wir das ursprüngliche Site Reliability Engineering Buch geschrieben haben, hatten wir ein Ziel: die Philosophie und die Prinzipien der Produktionstechnik und des Betriebs bei Google zu erklären. Mit dem Buch wollten wir die bewährten Methoden und Lektionen unserer Teams mit dem Rest der Computerwelt teilen. Wir gingen davon aus, dass das SRE-Buch nur eine bescheidene Anzahl von Ingenieuren ansprechen würde, die in großen, zuverlässigkeitsbewussten Unternehmen arbeiten, und dass sowohl die Menge als auch der Fokus des Inhalts die Attraktivität des Buches eher begrenzen würden.

Wie sich herausstellte, haben wir uns zum Glück in beiden Punkten geirrt.

Zu unserer Überraschung und Freude war das SRE-Buch nach seinem Erscheinen für einen aufregenden Zeitraum ein Bestseller in der Computerbranche, und es wurde nicht nur verkauft oder heruntergeladen, sondern auch gelesen. Wir erhielten aus der ganzen Welt Fragen zum Buch, zum Team, zu den Praktiken und zu den Resultaten. Wir wurden gebeten, über Kapitel, Ansätze und Vorfälle zu sprechen. Wir befanden uns in der unerwarteten Situation, dass wir Anfragen von außen ablehnen mussten, weil uns die Zyklen ausgegangen waren.

Wie die meisten Erfolgskatastrophen bot auch das SRE-Buch die Möglichkeit, mit menschlichem Einsatz ("Stellt mehr Leute ein! Haltet mehr Vorträge!") oder mit etwas Skalierbarem zu reagieren. Und da wir SREs sind, wird es nur wenige Leser überraschen, dass wir uns für den letzteren Ansatz entschieden haben. Wir beschlossen, ein zweites SRE-Buch zu schreiben - eines, das die Inhalte, zu denen wir am häufigsten gefragt wurden, vertieft und die häufigsten Fragen der Leser zum ersten Buch beantwortet.

Von den vielen verschiedenen Fragen, Wünschen und Kommentaren, die wir zum ersten SRE-Buch erhalten haben, waren für uns zwei Themen besonders interessant, die, wenn sie nicht beachtet werden, den produktiven Einsatz der SRE-Lektionen behindern. Diese Themen lassen sich umgangssprachlich wie folgt zusammenfassen:

  • Die Prinzipien sind interessant, aber wie setze ich sie in meinem Projekt/Team/Unternehmen um?

  • Der SRE-Ansatz würde für mich nicht funktionieren; er ist nur in der Google-Kultur machbar und macht nur in der Größenordnung von Google Sinn.

Ziel dieses zweiten SRE-Buches ist es, (a) die im ersten Band dargelegten Prinzipien um weitere Details zur Umsetzung zu ergänzen und (b) mit der Vorstellung aufzuräumen, dass SRE nur im "Google-Maßstab" oder in der "Google-Kultur" umsetzbar ist.

Dieser Band ist eine Ergänzung zum vorherigen Werk - keine neue Version. Die beiden Bücher sollten zusammen als Paar gelesen werden. Du wirst am meisten von diesem Buch profitieren, wenn du bereits mit seinem Vorgänger vertraut bist. Das erste SRE-Buch ist online kostenlos erhältlich.

Die Struktur dieses Buches folgt in etwa der Struktur des ersten Bandes. Wir möchten, dass du die Kapitel im Tandem lesen kannst. Jedes Kapitel in diesem Band setzt voraus, dass du mit seinem Gegenstück aus dem Vorgängerband vertraut bist; unser Ziel ist es, dass du zwischen den Prinzipien und der Praxis hin- und herspringen kannst, während du arbeitest. Auf diese Weise kannst du beide Bände als ständige Referenz verwenden.

Als Nächstes ein Wort zum Ethos: Wir haben von einigen Lesern gehört, dass wir uns bei der Beschreibung von Googles Weg zu besseren Abläufen zu sehr nur auf uns konzentriert haben. Einige Leser meinten, wir hätten uns zu weit von den praktischen Gegebenheiten außerhalb von Google entfernt und die Interaktion unserer Ideen mit den DevOps-Prinzipien verfehlt. Das ist eine durchaus berechtigte Kritik, die wir uns in diesem Band zu Herzen genommen haben.

Wir sind jedoch der Meinung, dass die hohe Meinungsvielfalt von SRE zu seiner Nützlichkeit als Disziplin beiträgt. Für uns ist das ein Vorteil und kein Nachteil. Wir behaupten nicht, dass SRE der einzige Weg (oder gar der allgemein beste Weg) ist, um hochzuverlässige Systeme zu entwickeln und zu betreiben. Es ist nur der Weg, der sich für uns am besten bewährt hat.

Wir werden auch ein paar Worte darüber verlieren, wie sich SRE und DevOps zueinander verhalten. Der wichtigste Punkt ist, dass sie nicht im Widerspruch zueinander stehen.

Wir möchten im Voraus darauf hinweisen, dass dieser Band zwangsläufig unvollständig ist. Die SRE-Disziplin ist ein weites Feld, selbst innerhalb der Grenzen von Google, und sie entwickelt sich jetzt noch schneller, da sie auch außerhalb von Google weit verbreitet ist. Anstatt uns breit und oberflächlich aufzustellen, haben wir uns in diesem Band auf die am häufigsten nachgefragten Implementierungsdetails des ersten Bandes konzentriert.

Schließlich sind dieser Band und sein Vorgänger nicht als Evangelium zu verstehen. Bitte behandle sie nicht auf diese Weise. Auch nach all den Jahren finden wir immer noch Umstände und Fälle, die uns dazu veranlassen, unsere Überzeugungen zu überdenken (oder in manchen Fällen zu ersetzen). SRE ist eine Reise, genauso wie es eine Disziplin ist.

Wir hoffen, dass dir die Lektüre gefällt und du das Buch nützlich findest. Die Zusammenstellung des Buches war ein hartes Stück Arbeit. Wir freuen uns, dass es eine wachsende und kompetente Gemeinschaft von SRE-Fachleuten gibt, von denen wir lernen und uns verbessern können.

Wie immer sind wir für dein direktes Feedback sehr dankbar. Jedes Mal, wenn du etwas beiträgst, lernen wir daraus etwas Wertvolles.

In diesem Buch verwendete Konventionen

In diesem Buch werden die folgenden typografischen Konventionen verwendet:

Kursiv

Weist auf neue Begriffe, URLs, E-Mail-Adressen, Dateinamen und Dateierweiterungen hin.

Constant width

Wird für Programmlistings sowie innerhalb von Absätzen verwendet, um auf Programmelemente wie Variablen- oder Funktionsnamen, Datenbanken, Datentypen, Umgebungsvariablen, Anweisungen und Schlüsselwörter hinzuweisen.

Constant width bold

Zeigt Befehle oder anderen Text an, der vom Benutzer wortwörtlich eingetippt werden sollte.

Constant width italic

Zeigt Text an, der durch vom Benutzer eingegebene Werte oder durch kontextabhängige Werte ersetzt werden soll.

Tipp

Dieses Element steht für einen Tipp oder eine Anregung.

Hinweis

Dieses Element steht für einen allgemeinen Hinweis.

Warnung

Dieses Element weist auf eine Warnung oder einen Warnhinweis hin.

Code-Beispiele verwenden

Zusätzliches Material (Code-Beispiele, Übungen usw.) steht unter http://g.co/SiteReliabilityWorkbookMaterials zum Download bereit .

Dieses Buch soll dir helfen, deine Arbeit zu erledigen. Wenn in diesem Buch Beispielcode angeboten wird, darfst du ihn in deinen Programmen und deiner Dokumentation verwenden. Du musst uns nicht um Erlaubnis fragen, es sei denn, du reproduzierst einen großen Teil des Codes. Wenn du zum Beispiel ein Programm schreibst, das mehrere Teile des Codes aus diesem Buch verwendet, brauchst du keine Erlaubnis. Wenn du eine CD-ROM mit Beispielen aus den O'Reilly-Büchern verkaufst oder verteilst, ist eine Genehmigung erforderlich. Die Beantwortung einer Frage mit einem Zitat aus diesem Buch und einem Beispielcode erfordert keine Genehmigung. Wenn du einen großen Teil des Beispielcodes aus diesem Buch in die Dokumentation deines Produkts aufnimmst, ist eine Erlaubnis erforderlich.

Wir schätzen die Namensnennung, verlangen sie aber nicht. Eine Quellenangabe umfasst normalerweise den Titel, den Autor, den Verlag und die ISBN. Zum Beispiel: "The Site Reliability Workbook, herausgegeben von Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara, und Stephen Thorne (O'Reilly). Copyright 2018 Google LLC, 978-1-492-02950-2."

Wenn du der Meinung bist, dass die Verwendung von Code-Beispielen nicht unter die Fair-Use-Regelung oder die oben genannte Erlaubnis fällt, kannst du uns gerne unter kontaktieren

O'Reilly Safari

Hinweis

Safari (ehemals Safari Books Online) ist eine mitgliedschaftsbasierte Schulungs- und Nachschlageplattform für Unternehmen, Behörden, Lehrkräfte und Einzelpersonen.

Mitglieder haben Zugang zu Tausenden von Büchern, Schulungsvideos, Lernpfaden, interaktiven Tutorials und kuratierten Playlists von über 250 Verlagen, darunter O'Reilly Media, Harvard Business Review, Prentice Hall Professional, Addison-Wesley Professional, Microsoft Press, Sams, Que, Peachpit Press, Adobe, Focal Press, Cisco Press, John Wiley & Sons, Syngress, Morgan Kaufmann, IBM Redbooks, Packt, Adobe Press, FT Press, Apress, Manning, New Riders, McGraw-Hill, Jones & Bartlett und Course Technology, um nur einige zu nennen.

Weitere Informationen erhältst du unter http://oreilly.com/safari.

Wie du uns kontaktierst

Bitte richte Kommentare und Fragen zu diesem Buch an den Verlag:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Nord
  • Sebastopol, CA 95472
  • 800-998-9938 (in den Vereinigten Staaten oder Kanada)
  • 707-829-0515 (international oder lokal)
  • 707-829-0104 (Fax)

Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter http://bit.ly/siteReliabilityWkbk aufrufen .

Wenn du Kommentare oder technische Fragen zu diesem Buch stellen möchtest, sende eine E-Mail an

Weitere Informationen zu unseren Büchern, Kursen, Konferenzen und Neuigkeiten findest du auf unserer Website unter http://www.oreilly.com.

Finde uns auf Facebook: http://facebook.com/oreilly

Folge uns auf Twitter: http://twitter.com/oreillymedia

Schau uns auf YouTube: http://www.youtube.com/oreillymedia

Danksagungen

Dieses Buch ist das Ergebnis der enthusiastischen und großzügigen Beiträge von mehr als 100 Personen, darunter Autoren, technische Redakteure und Rezensenten. In jedem Kapitel sind die einzelnen Autoren und technischen Redakteure aufgeführt. Wir möchten uns auch bei allen bedanken, die hier nicht aufgeführt sind.

Wir möchten uns bei den folgenden Reviewern für ihr wertvolles (und manchmal spitzes) Feedback bedanken: Abe Hassan, Alex Perry, Cara Donnelly, Chris Jones, Cody Smith, Dermot Duffy, Jarrod Todd, Jay Judkowitz, John T. Reese, Liz Fong-Jones, Mike Danese, Murali Suriar, Narayan Desai, Niccolò Cascarano, Ralph Pearson, Salim Virji, Todd Underwood, Vivek Rau, und Zoltan Egyed.

Wir möchten den folgenden Personen unsere tiefste Anerkennung dafür aussprechen, dass sie uns bei der Erstellung dieses Bandes als Qualitätssicherer gedient haben. Sie haben wesentliche Beiträge zum gesamten Band geleistet: Alex Matey, Max Luebbe, Matt Brown und JC van Winkel.

Als Leiter von Google SRE waren Benjamin Treynor Sloss und Ben Lutch die Hauptsponsoren dieses Buches innerhalb von Google. Ihr starker und unerschütterlicher Glaube an ein Nachfolgeprojekt, das dem ersten SRE-Buch würdig ist, war entscheidend für die Realisierung dieses Buches.

Die Autoren und technischen Redakteure werden in jedem Kapitel namentlich erwähnt, aber wir möchten auch die Personen würdigen, die mit ihren Beiträgen, Diskussionen und Kritiken zu jedem Kapitel beigetragen haben. In der Reihenfolge der Kapitel sind dies:

  • Kapitel 2: Javier Kohen, Patrick Eaton, Richard Bondi, Yaniv Aknin

  • Kapitel 4: Alex Matey, Clint Pauline, Cody Smith, JC van Winkel, Ola Kłapcińska, Štěpán Davidovič

  • Kapitel 5: Alex Matey, Clint Pauline, Cody Smith, Iain Cooke, JC van Winkel, Štěpán Davidovič

  • Kapitel 6: Dermot Duffy, James O'Keeffe, Stephen Thorne

  • Kapitel 7: Mark Brody

  • Kapitel 8: Alex Perry, Alex Hidalgo, David Huska, Sebastian Kirsch, Sabrina Farmer, Steven Carstensen, Liz Fong-Jones, Nandu Shah (Evernote), Robert Holley (Evernote)

  • Kapitel 9: Alex Hidalgo, Alex Matey, Alex Perry, Dave Rensin, Matt Brown, Tor Gunnar Houeland, Trevor Strohman

  • Kapitel 10: John T. Reese

  • Kapitel 11: Daniel E. Eisenbud, Dave Rensin, Dmitry Nefedkin, Dževad Trumić, Edward Wu (Niantic), JC van Winkel, Lucas Pereira, Luke Stone, Matt Brown, Natalia Sakowska, Niall Richard Murphy, Phil Keslin (Niantic), Rita Sodt, Scott Devoid, Simon Donovan, Tomasz Kulczyński

  • Kapitel 12: Ivo Krka, Matt Brown, Nicky Nicolosi, Tanya Reilly

  • Kapitel 13: Bartosz Janota (Spotify), Cara Donnelly, Chris Farrar, Johannes Rußek (Spotify), Max Charas, Max Luebbe, Michelle Duffy, Nelson Arapé (Spotify), Riccardo Petrocco (Spotify), Rickard Zwahlen (Spotify), Robert Stephenson (Spotify), Steven Thurgood

  • Kapitel 14: Charlene Perez, Dave Cunningham, Dave Rensin, JC van Winkel, John Reese, Stephen Thorne

  • Kapitel 15: Alex Matey, Bo Shi, Charlene Perez, Dave Rensin, Eric Johnson, Juliette Benton, Lars Wander, Mike Danese, Narayan Desai, Niall Richard Murphy, Štěpán Davidovič, Stephen Thorne

  • Kapitel 16: Alex Matey, Liz Fong-Jones, Max Luebbe

  • Kapitel 17: Andrew Harvey, Aleksander Szymanek, Brad Kratochvil, Ed Wehrwein, Duncan Sargeant, Jessika Reissland, Matt Brown, Piotr Sieklucki und Thomas Adamcik

  • Kapitel 18: Brian Balser(New York Times), Deep Kapadia(New York Times), Michelle Duffy, Xavier Llorà

  • Kapitel 19: Matt Brown

  • Kapitel 20: Brian Balser(New York Times), Christophe Kalt, Daniel Rogers, Max Luebbe, Niall Richard Murphy, Ramón Medrano Llamas, Richard Bondi, Steven Carstensen, Stephen Thorne, Steven Thurgood, Thomas Wright

  • Kapitel 21: Dave Rensin, JC Van Winkel, Max Luebbe, Ronen Louvton, Stephen Thorne, Tom Feiner, Tsiki Rosenman

Wir danken auch den folgenden Personen, die wichtige Fachkenntnisse oder Ressourcen zur Verfügung gestellt haben oder auf andere Weise einen hervorragenden Einfluss auf diese Arbeit hatten: Caleb Donaldson, Charlene Perez, Evan Leonard, Jennifer Petoff, Juliette Benton und Lea Miller.

Wir sind sehr dankbar für das aufmerksame und ausführliche Feedback, das wir von den Fachkritikern erhalten haben: Mark Burgess, David Blank-Edelman, John Looney, Jennifer Davis, Björn Rabenstein, Susan Fowler, Thomas A. Limoncelli, James Meickle, Theo Schlossangle, Jez Humble, Alice Goldfuss, Arup Chakrabarti, John Allspaw, Angus Lees, Eric Liang, Brendan Gregg, und Bryan Liles.

Unser besonderer Dank gilt Shylaja Nukala, die großzügig ihre Zeit und ihre Fähigkeiten dem SRE Technical Writing Team zur Verfügung gestellt hat. Sie hat die notwendigen und geschätzten Bemühungen enthusiastisch unterstützt.

Wir danken auch dem Team von O'Reilly Media - Virginia Wilson, Kristen Brown, Rachel Monaghan, Nikki McDonald, Melanie Yarbrough und Gloria Lukos - für ihre Hilfe und Unterstützung bei der Umsetzung des Buches in unserem ehrgeizigen Zeitplan.

Ein ganz besonderer Dank geht an Niall Richard Murphy: Obwohl er Google verlassen hat, bevor dieses Buch in die Regale kam, waren seine kontinuierlichen Einblicke und sein Engagement entscheidend dafür, dass ein großer Teil der bedeutenden Inhalte die Ziellinie überquert hat. Seine Führungsqualitäten, sein Durchsetzungsvermögen, seine Hartnäckigkeit und sein Witz sind einfach inspirierend!

Schließlich möchten sich die Herausgeber auch persönlich bei den folgenden Personen bedanken:

  • Betsy Beyer: An meine Großmutter, meine beste Quelle für Ermutigung, Inspiration, Popcorn, Aufmunterung und Rätselraten. Du hast sowohl dieses Buch als auch mein tägliches Leben besser gemacht! An Duzzie, Hammer, Joan, Kiki und Mini (man beachte die alphabetische Reihenfolge - haha!), die mir geholfen haben, mich zu der besessenen Autorin und Person zu machen, die ich heute bin. Und natürlich an Riba, der mir die DMD und andere Dinge zur Verfügung gestellt hat, die ich für diese Arbeit brauchte.

  • Niall Richard Murphy: Für Léan, Oisín, Fiachra und Kay, die Nordsterne. Für jemanden, dessen Beteuerungen von Eigennutz völlig im Widerspruch zu seinem Handeln stehen. Auf Sharon, die einflussreicher ist, als sie ahnt. An Alex, in einem lichtdurchfluteten Wohnzimmer, mit einer Tasse Tee, einem Buch, einer Schachtel mit Würfeln und dir.

  • Stephen Thorne: An meine Mutter und meinen Vater, die mich immer ermutigt haben, an meine Grenzen zu gehen. An meine Frau Elspeth. An meine Kolleginnen und Kollegen, die mir mehr Respekt und Ermutigung entgegengebracht haben, als ich glaube, dass ich es verdient habe: Ola, Štěpán, Perry und David.

  • Dave Rensin: Nachdem ich mein erstes Buch geschrieben hatte, schwor ich mir, nie wieder ein anderes zu schreiben. Das ist jetzt sechs Bücher her und ich sage jedes Mal genau das Gleiche. Zu meiner Frau Lia, die mir den Freiraum dafür gibt und nie sagt: "Ich hab's dir ja gesagt. (Auch wenn sie es mir sagt.) An meine Kolleginnen und Kollegen bei Google - und insbesondere an die SRE-Familie -, die mir in den letzten Jahren mehr über Production Engineering im großen Maßstab beigebracht haben, als ich in den 20 Jahren zuvor gelernt hatte. Und schließlich an Benjamin Treynor Sloss, der mich interviewt und überzeugt hat, zu Google zu kommen.

  • Kent Kawahara: Meinen Eltern Denby und Setsuko und meiner Tante Asako dafür, dass sie mir geholfen haben, dahin zu kommen, wo ich jetzt bin. Meinen Geschwistern, Randy und Patti, für ihre Unterstützung über die Jahre hinweg. Meiner Frau Angela und meinen Söhnen Ryan, Ethan und Brady für ihre Liebe und Unterstützung. Und schließlich an das Kernteam, bestehend aus Dave, Betsy, Niall, Juliette und Stephen: Ich fühle mich geehrt, mit euch an diesem Projekt gearbeitet zu haben.

Get Das Arbeitsbuch zur Standortzuverlässigkeit now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.