Kapitel 11. Streaming mit Apache Iceberg

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Unter Streaming-Daten versteht man die kontinuierliche Erzeugung und Verarbeitung von Daten, die oft aus verschiedenen Quellen stammen. Diese Quellen können unter anderem Logfiles, Sensordaten, Social Media Feeds und Finanztransaktionen sein. Die Daten werden in kleinen Formaten (oder Paketen) gesendet, um Einblicke und Reaktionen in Echtzeit zu ermöglichen. Das Wesen von Streaming-Daten ist, dass sie ständig in Bewegung sind und weder einen bestimmten Anfang noch ein bestimmtes Ende haben.

Das Konzept der Streaming-Daten ist im heutigen Zeitalter der digitalen Informationen von entscheidender Bedeutung, da Unternehmen, Forschungseinrichtungen und Behörden oft auf der Grundlage möglichst aktueller Daten analysieren und Entscheidungen treffen müssen. Finanzinstitute zum Beispiel können Streaming-Daten nutzen, um betrügerische Transaktionen sofort zu erkennen. Ebenso nutzen soziale Medienplattformen Streaming-Daten, um die Feeds der Nutzer/innen auf der Grundlage von Echtzeit-Kennzahlen anzupassen und zu aktualisieren.

Es gibt mehrere Gründe, warum man Daten in eine Apache Iceberg-Tabelle streamen möchte:

Skalierbarkeit und Leistung

Apache Iceberg wurde entwickelt, um Informationen aus großen Datenbeständen effizient zu speichern und abzurufen. Die Dateiverwaltung ermöglicht es, die Leistung eines sich ständig ...

Get Apache Iceberg: Der endgültige Leitfaden now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.