Kapitel 6. Batch ist ein Spezialfall von Streaming

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bisher haben wir in diesem Buch über die unbegrenzte Verarbeitung von Datenströmen gesprochen, d. h. die Verarbeitung von Daten ab einem bestimmten Zeitpunkt kontinuierlich und für immer. Dieser Zustand ist in Abbildung 6-1 dargestellt.

Unbounded stream processing: the input does not have an end, and data processing starts from the present or some point in the past and continues indefinitely.
Abbildung 6-1. Unbegrenzte Stream-Verarbeitung: Die Eingabe hat kein Ende, und die Datenverarbeitung beginnt in der Gegenwart oder an einem Punkt in der Vergangenheit und wird unbegrenzt fortgesetzt.

Eine andere Art der Verarbeitung ist die Verarbeitung von begrenzten Datenströmen (bounded stream processing) oder die Verarbeitung von Daten von einem bestimmten Startzeitpunkt bis zu einem bestimmten Endzeitpunkt, wie in Abbildung 6-2 dargestellt. Die Eingabedaten können von Natur aus begrenzt sein (d. h. es handelt sich um einen Datensatz, der im Laufe der Zeit nicht wächst), oder sie können zu Analysezwecken künstlich begrenzt werden (d. h. wir sind nur an Ereignissen innerhalb einer bestimmten Zeitspanne interessiert).

Bounded stream processing: the input has a beginning and an end, and data processing stops after some time.
Abbildung 6-2. Begrenzte Stream-Verarbeitung: Die Eingabe hat einen Anfang und ein Ende, und die Datenverarbeitung endet nach einer gewissen Zeit. ...

Get Einführung in Apache Flink now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.