Kapitel 2. Stream Processing Plattformen
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In Kapitel 1 haben wir einen einfachen Anwendungsfall vorgestellt, bei dem es darum geht, Echtzeitdaten zu den Verbrauchern zu bringen. Außerdem haben wir Konnektoren vorgestellt und erklärt, wie sie ruhende Daten in bewegte Daten (oder Ereignisströme) umwandeln und diese dann in Themen auf Streaming-Plattformen veröffentlichen können.
Die Ereignisströme von können jetzt gelesen werden, aber sie liegen wahrscheinlich noch nicht in einem Format vor, das die Verbraucher nutzen können. Die Ereignisse müssen in der Regel bereinigt und aufbereitet werden, bevor sie analytisch verarbeitet werden können. Außerdem müssen die Ereignisse mit Kontext angereichert werden, damit sie nützlich genug sind, um Erkenntnisse zu gewinnen. Die analytische Verarbeitung hängt stark von der Genauigkeit und Zuverlässigkeit der Daten ab. Durch die Beseitigung von Problemen wie fehlenden Werten, Inkonsistenzen, Duplikaten und Ausreißern wird die Datenqualität verbessert, was zu zuverlässigeren und genaueren Analyseergebnissen führt.
Wie in Abbildung 2-1 dargestellt, kann die Vorbereitung von Ereignisdaten auch die Leistung von analytischen Abfragen erheblich beeinflussen. Durch die Optimierung des Datenlayouts, der Indizierung und der Partitionierung kann die Effizienz der Datenabfrage und -verarbeitung verbessert werden. Dazu gehören ...
Get Streaming-Datenbanken now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.