Kapitel 5. Die DataStream-API (v1.7)
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Dieses Kapitel führt in die Grundlagen der DataStream-API von Flink ein. Wir zeigen die Struktur und die Komponenten einer typischen Flink-Streaming-Anwendung, besprechen die Typsysteme von Flink und die unterstützten Datentypen und stellen Daten- und Partitionierungstransformationen vor. Fensteroperatoren, zeitbasierte Transformationen, zustandsabhängige Operatoren und Konnektoren werden in den nächsten Kapiteln behandelt. Nach der Lektüre dieses Kapitels weißt du, wie du eine Stream Processing-Anwendung mit grundlegenden Funktionen implementieren kannst. In unseren Codebeispielen verwenden wir aus Gründen der Übersichtlichkeit Scala, aber die Java-API ist größtenteils analog (auf Ausnahmen oder Sonderfälle werden wir hinweisen). Vollständige Beispielanwendungen, die in Java und Scala implementiert wurden, findest du auch in unseren GitHub-Repositories.
Hallo, Flink!
Beginnen wir mit einem einfachen Beispiel, um einen ersten Eindruck davon zu bekommen, wie es ist, Streaming-Anwendungen mit der DataStream-API zu schreiben. Anhand dieses Beispiels werden wir die grundlegende Struktur eines Flink-Programms zeigen und einige wichtige Funktionen der DataStream-API vorstellen. Unsere Beispielanwendung nimmt einen Strom von Temperaturmessungen von mehreren Sensoren auf.
Werfen wir zunächst einen Blick auf den Datentyp, ...