Capítulo 18. Manejo de datos erróneos en flujos de eventos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
A un alto nivel, los datos malos son datos que no se ajustan a lo que se espera; por ejemplo, una dirección de correo electrónico sin la @ o una caducidad de tarjeta de crédito en la que el formato MM/YYYY está cambiado por YYYY/MM. Los datos malos también pueden incluir datos malformados y corruptos, de tal manera que sean completamente indescifrables y efectivamente basura. Este capítulo cubre cómo pueden llegar a ser datos malos, y cómo puedes tratar con ellos cuando se trata de flujos de eventos.
Los flujos de eventos se basan en un registro inmutable, en el que los datos, una vez escritos, no pueden editarse ni borrarse (fuera de la caducidad o la compactación -más sobre esto más adelante en el capítulo-). A pesar de todas las ventajas del registro inmutable, el inconveniente es que hace que sea más difícil tratar los datos erróneos. No puedes simplemente acceder a ellos y editarlos una vez producidos en el flujo, como podrías hacer con los datos de un almacén de datos mutable.
No existe una única forma eficaz de gestionar los datos erróneos en los flujos de eventos. En su lugar, tendrás que confiar en un conjunto de estrategias para prevenir, mitigar y arreglar los datos erróneos en los flujos. Las estrategias más exitosas para mitigar y arreglar los datos erróneos en los flujos incluyen, por orden: ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access