Kapitel 2. Das Was, Wo, Wann und Wie der Datenverarbeitung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Okay, ihr Partygänger, es wird Zeit, konkret zu werden!

Kapitel 1 konzentrierte sich auf drei Hauptbereiche: Terminologie, wobei ich genau definiere, was ich meine, wenn ich überladene Begriffe wie "Streaming" verwende; Batch versus Streaming, wobei ich die theoretischen Fähigkeiten der beiden Systemtypen vergleiche und postuliere, dass nur zwei Dinge notwendig sind, um Streaming-Systeme über ihre Batch-Gegenstücke hinauszuheben: Korrektheit und Werkzeuge für das Denken über die Zeit; und Datenverarbeitungsmuster, wobei ich die konzeptionellen Ansätze betrachte, die sowohl bei Batch- als auch bei Streaming-Systemen bei der Verarbeitung begrenzter und unbegrenzter Daten verwendet werden.

In diesem Kapitel werden wir uns weiter auf die Datenverarbeitungsmuster aus Kapitel 1 konzentrieren, aber detaillierter und im Kontext konkreter Beispiele. Wenn wir fertig sind, haben wir das behandelt, was ich für den Kern der Prinzipien und Konzepte halte, die für eine robuste Datenverarbeitung außerhalb der Reihenfolge erforderlich sind; das sind die Werkzeuge für das Denken über die Zeit, die dich wirklich über die klassische Stapelverarbeitung hinausbringen.

Um dir ein Gefühl dafür zu geben, wie die Dinge in Aktion aussehen, verwende ich Schnipsel aus dem Apache Beam Code, gepaart mit Zeitraffer-Diagrammen ...

Get Streaming-Systeme now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.