Kapitel 3. Lebenszyklus von Schreib- und Leseabfragen
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Das Apache Iceberg-Tabellenformat bietet leistungsstarke Abfragen während des Lesens und Schreibens, so dass du OLAP-Workloads (Online Analytical Processing) direkt auf dem Data Lake ausführen kannst. Ermöglicht wird diese Leistung durch die Art und Weise, wie die verschiedenen Komponenten des Iceberg-Tabellenformats aufgebaut sind. Deshalb ist es wichtig, die Struktur dieser Komponenten zu verstehen, damit Abfrage-Engines sie effektiv für eine schnellere Abfrageplanung und -ausführung nutzen können. Wir haben diese architektonischen Komponenten in Kapitel 2 ausführlich besprochen. Auf einer hohen Ebene können alle diese Komponenten in drei verschiedene Schichten unterteilt werden, wie in Abbildung 3-1 dargestellt.
Schauen wir uns kurz an, wie eine Abfrage-Engine beim Lesen und Schreiben mit diesen Komponenten interagiert:
- Katalog-Ebene
Wie du in Kapitel 2 gelernt hast, enthält ein Katalog die Verweise auf den aktuellen Metadatenzeiger, d.h. die neueste Metadatendatei für jede Tabelle. Unabhängig davon, ob du eine Lese- oder eine Schreiboperation durchführst, ist der Katalog die erste Komponente, mit der eine Abfrage-Engine interagiert. Bei ...
Get Apache Iceberg: Der endgültige Leitfaden now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.