Kapitel 12. Katastrophenhilfe

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Wenn es dir wie den meisten Nutzern geht, hast du Kubernetes wahrscheinlich zumindest teilweise wegen seiner Fähigkeit zur automatischen Wiederherstellung nach einem Ausfall geschätzt. Und natürlich leistet Kubernetes großartige Arbeit, um deine Workloads am Laufen zu halten. Aber wie bei jedem komplexen System kann es auch hier zu Ausfällen kommen. Ganz gleich, ob es sich um einen Hardwaredefekt eines Knotens oder um einen Datenverlust im etcd-Cluster handelt, wir wollen Systeme haben, die sicherstellen, dass wir uns rechtzeitig und zuverlässig wiederherstellen können.

Hohe Verfügbarkeit

Ein erster Grundsatz jeder Disaster-Recovery-Strategie ist es, deine Systeme so zu gestalten, dass die Möglichkeit eines Ausfalls von vornherein minimiert wird. Natürlich ist es unmöglich, ein narrensicheres System zu entwickeln, aber wir sollten bei der Entwicklung immer den schlimmsten Fall im Hinterkopf haben.

Beim Aufbau von produktionsfähigen Kubernetes-Clustern ist es nach bewährten Methoden immer wichtig, dass kritische Komponenten hochverfügbar sind. In einigen Fällen, wie z. B. beim API-Server, kann es sich um eine aktiv-aktive Konfiguration handeln, während Elemente wie das Zeitplannungsprogramm und der Controller Manager aktiv-passiv arbeiten. Wenn diese Steuerebenen richtig eingesetzt werden, sollte ein Benutzer nicht ...

Get Kubernetes verwalten now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.