Capítulo 8. Cero-ETL o casi-cero-ETL

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 7, presentamos en las bases de datos híbridas emergentes que ofrecen soluciones alternativas para soportar la analítica en tiempo real. Estos sistemas reducen la infraestructura y hacen que los datos sean más accesibles para las cargas de trabajo analíticas. Dado que en los sistemas híbridos convergen sistemas tradicionalmente distribuidos, existe la suposición de que los sistemas híbridos se inclinan hacia un sistema monolítico. Los sistemas monolíticos suelen ser conocidos por carecer de modularidad y escalabilidad al realizar cargas de trabajo de datos.

Irónicamente, descomponer un sistema de datos monolítico nos devolverá a descomponer una base de datos y volverla del revés para escalar específicamente los componentes individuales. Esto no es necesariamente una solución negativa. En este libro, hemos estado proponiendo devolver estos sistemas a la base de datos para reducir la complejidad y el coste, que tradicionalmente se asocian a los grandes sistemas distribuidos.

ETL es la forma en que movemos los datos de un sistema a otro, transformándolos por el camino. Hasta ahora, hemos utilizado una forma de ETL llamada streaming SQL. En este capítulo, hablaremos de cómo equilibrar la complejidad y la escalabilidad en la implementación de ETL echando un vistazo a los sistemas y patrones existentes que se utilizan ...

Get Bases de datos de streaming now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.