Capítulo 4. Fundamentos económicos de las tuberías
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En los capítulos anteriores has aprendido a diseñar soluciones de computación y almacenamiento en la nube que ofrezcan las compensaciones adecuadas entre coste y rendimiento, teniendo en cuenta los objetivos generales del producto. Esto te proporciona una base sólida para un diseño rentable.
El siguiente paso consiste en diseñar e implantar canalizaciones de datos que se escalen eficazmente, limiten el despilfarro haciendo un uso inteligente de los recursos de ingeniería y computación, y minimicen el tiempo de inactividad de los datos. La primera parte de este proceso implica algunas estrategias de diseño fundamentales para los conductos de datos: idempotencia, puntos de control, reintentos automáticos y validación de datos.
En este capítulo, verás los problemas habituales de las canalizaciones de datos y cómo mitigarlos utilizando estas cuatro estrategias. En lugar de limitarme a definir la idempotencia, la comprobación, los reintentos y la validación de datos, ilustraré cómo aplicar estas estrategias en entornos por lotes y de flujo, y discutiré algunas de las ventajas y desventajas que encontrarás. También podrás ver cómo estas estrategias (o la falta de ellas) contribuyeron a los fracasos y éxitos de las canalizaciones del mundo real.
Idempotencia
El primer punto de partida es diseñar tus canalizaciones para ...