Kapitel 8. AWS-Kleber

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

AWS Glue ist ein vollständig verwalteter Datenintegrationsservice, der eine optimierte Methode zur Vorbereitung und Integration von Daten für verschiedene analytische Arbeitslasten, wie Business Intelligence (BI) und maschinelles Lernen (ML), bietet. Außerdem bietet er eine benutzerfreundliche visuelle Schnittstelle, die die Erstellung, Ausführung und Verwaltung von Aufträgen vereinfacht. Durch den Einsatz von AWS Glue können Benutzer den skalierbaren, serverlosen Datenkatalog zur Verwaltung ihrer Arbeitsabläufe nutzen. AWS Glue 3.0 und spätere Versionen unterstützen das Apache Iceberg Tabellenformat. Das bedeutet, dass du Glue zusammen mit Iceberg für eine Reihe von Vorgängen nutzen kannst, z. B. zum Erstellen von Iceberg-Tabellen in Objektspeichern wie Amazon Simple Storage Service (Amazon S3), zum Ausführen von Lese- und Schreibvorgängen oder einfach nur zum Speichern aller Iceberg-Tabellen im Glue-Katalog.

In diesem Kapitel lernst du, wie du AWS Glue mit Apache Iceberg Tabellen konfigurierst und verschiedene Operationen wie CREATE, READ und INSERT durchführst.

Zum jetzigen Zeitpunkt unterstützt AWS Glue 4.0 Iceberg v1.0.0, während AWS Glue 3.0 Iceberg v0.13.1 unterstützt.

Konfiguration

Das Integrationstool AWS Glue arbeitet mit "Aufträgen", die eine einzelne Arbeitseinheit darstellen, die Daten von einer Quelle (irgendwo) ...

Get Apache Iceberg: Der endgültige Leitfaden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.