Capítulo 9. Integración de datos con ksqlDB

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El primer paso para construir una aplicación de procesamiento de flujos con ksqlDB es considerar dónde viven actualmente los datos que quieres que procese, y dónde se escribirán finalmente los datos enriquecidos/transformados. Dado que ksqlDB aprovecha Kafka Streams bajo el capó, las entradas y salidas directas de la aplicación que construyas serán siempre temas de Kafka. ksqlDB también simplifica la integración de otras fuentes de datos, incluidas las de sistemas populares de terceros como Elasticsearch, PostgreSQL, MySQL, Google PubSub, Amazon Kinesis, MongoDB y cientos más.

Por supuesto, si tus datos ya viven en Kafka y no planeas escribir los resultados procesados en un sistema externo, entonces no es necesario trabajar con las funciones de integración de datos de ksqlDB (que están controladas por Kafka Connect). Sin embargo, si alguna vez necesitas leer de/escribir en sistemas externos, este capítulo te proporcionará las bases necesarias para ayudarte a conectar las fuentes y sumideros de datos apropiados utilizando ksqlDB y Kafka Connect.

Este capítulo no es una guía exhaustiva sobre Kafka Connect, que es una API independiente en el ecosistema Kafka y, en consecuencia, un tema sobre el que se puede escribir y se ha escrito mucho. Proporcionaremos suficientes antecedentes para que puedas empezar, y veremos las abstracciones ...

Get Dominar Kafka Streams y ksqlDB now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.