Book description
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Die Arbeit mit unbegrenzten und sich schnell bewegenden Datenströmen war in der Vergangenheit schwierig. Aber mit Kafka Streams und ksqlDB ist es einfach und macht Spaß, Stream-Processing-Anwendungen zu entwickeln. Dieser praktische Leitfaden zeigt Dateningenieuren, wie sie mit diesen Tools hoch skalierbare Stream-Processing-Anwendungen erstellen können, um große Datenmengen in Echtzeit zu bewegen, anzureichern und zu transformieren.
Mitch Seymour, Data Services Engineer bei Mailchimp, erklärt wichtige Stream-Processing-Konzepte vor dem Hintergrund einiger interessanter Geschäftsprobleme. Du lernst die Stärken von Kafka Streams und ksqlDB kennen, damit du das beste Tool für jedes einzelne Stream Processing-Projekt auswählen kannst. Für Nicht-Java-Entwickler ist der ksqlDB-Pfad ein besonders sanfter Einstieg in die Stream-Verarbeitung.
- Lerne die Grundlagen von Kafka und das Pub/Sub-Kommunikationsmuster
- Baue zustandslose und zustandsabhängige Stream-Processing-Anwendungen mit Kafka Streams und ksqlDB
- Ausführen fortgeschrittener zustandsabhängiger Operationen, einschließlich Windowed Joins und Aggregationen
- Verstehen, wie zustandsabhängige Verarbeitung unter der Haube funktioniert
- Lerne die Datenintegrationsfunktionen von ksqlDB kennen, die von Kafka Connect unterstützt werden
- mit verschiedenen Arten von Sammlungen in ksqlDB arbeiten und Push- und Pull-Abfragen durchführen
- Setze deine Kafka Streams und ksqlDB-Anwendungen in der Produktion ein
Table of contents
- Vorwort
- Vorwort
- I. Kafka
- 1. Eine schnelle Einführung in Kafka
- II. Kafka-Streams
- 2. Erste Schritte mit Kafka Streams
-
3. Zustandslose Verarbeitung
- Zustandslose versus zustandsorientierte Verarbeitung
- Einführung in unser Tutorial: Verarbeitung eines Twitter-Streams
- Projekt einrichten
- Hinzufügen eines KStream-Quellprozessors
- Serialisierung/Desialisierung
- Daten filtern
- Daten verzweigen
- Tweets übersetzen
- Ströme zusammenführen
- Bereichernde Tweets
- Avro-Daten serialisieren
- Hinzufügen eines Senkenprozessors
- Den Code ausführen
- Empirische Überprüfung
- Zusammenfassung
-
4. Zustandsbezogene Verarbeitung
- Vorteile der zustandsorientierten Verarbeitung
- Vorschau auf zustandsabhängige Operatoren
- Staatliche Läden
- Wir stellen unser Tutorial vor: Videospiel-Rangliste
- Projekt einrichten
- Datenmodelle
- Hinzufügen der Quellprozessoren
- Registrierung von Streams und Tabellen
- Tritt bei
- Datensätze gruppieren
- Aggregationen
- Alles zusammenfügen
- Interaktive Abfragen
- Zusammenfassung
- 5. Fenster und Zeit
-
6. Erweiterte Zustandsverwaltung
- Persistent Store Disk Layout
- Fehlertoleranz
- Rebalancing: Feind des Staates (Store)
- Verhinderung der Staatsmigration
- Verringerung der Auswirkungen von Rebalances
- Deduplizierung von Schreibvorgängen mit Datensatz-Caches
- State Store Überwachung
- Eingebaute Metriken
- Interaktive Abfragen
- Custom State Stores
- Zusammenfassung
-
7. Prozessor-API
- Wann wird die Prozessor-API verwendet?
- Wir stellen unser Tutorial vor: IoT Digital Twin Service
- Projekt einrichten
- Datenmodelle
- Hinzufügen von Quellprozessoren
- Hinzufügen zustandsloser Stream-Prozessoren
- Zustandslose Prozessoren erstellen
- Zustandsabhängige Prozessoren erstellen
- Periodische Funktionen mit Interpunktionszeichen
- Zugriff auf Datensatz-Metadaten
- Hinzufügen von Sink-Prozessoren
- Interaktive Abfragen
- Alles zusammenfügen
- Die Kombination der Prozessor-API mit der DSL
- Prozessoren und Transformatoren
- Alles zusammenfügen: Refactor
- Zusammenfassung
- III. ksqlDB
- 8. Erste Schritte mit ksqlDB
- 9. Datenintegration mit ksqlDB
- 10. Grundlagen der Stream-Verarbeitung mit ksqlDB
- 11. Fortgeschrittene und erweiterte Stream-Verarbeitung mit ksqlDB
- IV. Der Weg zur Produktion
- 12. Testen, Überwachen und Einsetzen
- A. Kafka Streams Konfiguration
- B. ksqlDB Konfiguration
- Index
Product information
- Title: Kafka Streams und ksqlDB beherrschen
- Author(s):
- Release date: September 2024
- Publisher(s): O'Reilly Media, Inc.
- ISBN: 9781098189273
You might also like
article
Run Llama-2 Models Locally with llama.cpp
Llama is Meta’s answer to the growing demand for LLMs. Unlike its well-known technological relative, ChatGPT, …
book
WebSphere MQ in a z/OS Parallel Sysplex Environment
This IBM Redbooks publication looks at the latest enhancements to WebSphere MQ for z/OS and shows …
book
z/TPF and WebSphere Application Server in a Service Oriented Architecture
In the simplest terms, Service Oriented Architecture (SOA) is a means by which unlike (or like) …
book
Using MQSeries for VSE
This IBM Redbooks publication will help you get started with MQSeries for VSE V2R1.2. It explores …