Capítulo 61. Seis dimensiones para elegir un almacén de datos analíticos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Gleb Mezhanskiy

El almacén de datos (DWH) desempeña un papel central en el ecosistema de datos. También suele ser la pieza de la infraestructura de datos más cara de sustituir, por lo que es importante elegir la solución adecuada y que pueda funcionar bien durante al menos siete años. Dado que la analítica se utiliza para impulsar importantes decisiones empresariales, elegir el DWH equivocado es una forma segura de crear un costoso cuello de botella para tu empresa.

En este capítulo, propongo seis dimensiones para evaluar una solución de almacenamiento de datos para los siguientes casos de uso:

  • Ingesta y almacenamiento de todos los datos analíticos

  • Ejecutar transformaciones de datos (la T de ELT)

  • Servir datos a los consumidores (impulsar cuadros de mando y análisis ad hoc)

Escalabilidad

Las empresas que eligen almacenes de datos poco escalables pagan un enorme impuesto a su productividad cuando sus DWH ya no pueden crecer: las consultas se atascan, los usuarios se bloquean y la empresa se ve obligada a migrar a un DWH de mejor escalabilidad. Sin embargo, en el momento en que sientes el dolor, ya es demasiado tarde: las migraciones son lentas (años), dolorosas y casi nunca se completan.

Get 97 cosas que todo ingeniero de datos debe saber now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.