Kapitel 13. Sicherung und Disaster Recovery

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel geht es darum, eine solide Strategie zu entwickeln, um die Daten in einem Hadoop-basierten System sicher und verfügbar zu halten, so dass im Falle eines Datenverlusts durch einen Benutzerfehler (irrtümlich gelöschte Daten) oder eine Katastrophe (z. B. den Verlust des gesamten Clusters) eine Wiederherstellung eingeleitet und abgeschlossen werden kann. Durch diese Wiederherstellung erhalten die Nutzer des Clusters einen zuverlässigen Zustand, so dass sie mit ihren Aufgaben fortfahren können.

Beachte, dass dies auch bei aktivierter Hochverfügbarkeit (siehe Kapitel 12) notwendig ist, denn die Wiederherstellung von Daten gilt auch für Probleme, die nicht durch die Aufrechterhaltung eines reaktionsfähigen Dienstes entstehen. Ganz im Gegenteil. Selbst bei redundanten Komponenten auf jeder Ebene des Stacks kann der Verlust von Metadaten oder Daten zu einer Unterbrechung führen, die nur mit der richtigen Backup- oder Disaster-Recovery-Strategie im Vorfeld abgefedert werden kann.

Kontext

Bevor wir uns mit den einzelnen Ansätzen befassen können, müssen wir zunächst einen Kontext herstellen.

Viele verteilte Systeme

Hadoop ist ein komplexes System, das aus vielen Open-Source-Projekten besteht, die zusammenarbeiten, um eine einzigartige Datenverarbeitungsplattform zu schaffen. Es ist die Grundlage ...

Get Architektur von modernen Datenplattformen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.