Capítulo 5. Introducción a las bases de datos de streaming
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En una hoja de cálculo, puedes poner una fórmula en una celda (por ejemplo, la suma de celdas de otra columna), y siempre que cambie cualquier entrada de la fórmula, el resultado de ésta se recalcula automáticamente. Esto es exactamente lo que queremos a nivel de sistema de datos: cuando cambia un registro en una base de datos, queremos que cualquier índice de ese registro se actualice automáticamente, y que cualquier vista o agregación en caché que dependa del registro se actualice automáticamente. No deberías tener que preocuparte por los detalles técnicos de cómo se produce esta actualización, sino simplemente confiar en que funciona correctamente.
Martin Kleppmann, Diseño de aplicaciones intensivas en datos
En , el capítulo anterior, aprendimos a "dar la vuelta a la base de datos", como tan acertadamente lo ha acuñado Martin Kleppmann. Esto implicaba externalizar la WAL de una base de datos en flujos de cambios de entrada, crear vistas materializadas sobre ellos y volver a escribir los datos procesados en flujos de cambios de salida. A diferencia de las vistas materializadas en bases de datos clásicas, como Oracle o Postgres, en las que los intervalos de actualización oscilan entre unos minutos y unas horas, las vistas materializadas en plataformas de procesamiento de flujos como Flink, Kafka Streams, ...
Get Bases de datos de streaming now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.