Capítulo 23. Los almacenes de datos son el pasado, el presente y el futuro

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

James Densmore

La muerte del almacén de datos, profetizada desde hace tiempo, parece estar siempre en el horizonte, pero nunca se hace realidad. Primero fue NoSQL, luego Hadoop y después los lagos de datos los que acabarían con el almacén de datos. Sin embargo, aquí estamos. Snowflake fue la oferta pública inicial (OPI) más caliente de 2020, y la demanda de ingenieros de datos y análisis que puedan extraer valor de un almacén de datos es más alta que nunca.

En 2010, el futuro de los almacenes de datos parecía bastante sombrío. La mayoría de los equipos de análisis confiaban en las tradicionales bases de datos de procesamiento transaccional en línea (OLTP) basadas en filas para sus almacenes de datos. El volumen de datos se disparaba. A la hora de procesar y consultar todos esos datos para su análisis, las bases de datos columnares venían al rescate, pero requerían un hardware en expansión.

Mientras que los dispositivos bare-metal de almacén de datos proporcionaban un salto masivo en la potencia de procesamiento, añadir el hardware a tu sala de servidores suponía toda una inversión. Es inimaginable 10 años después.

Las cosas cambiaron a mejor en 2012, cuando Amazon lanzó Redshift, un almacén ...

Get 97 cosas que todo ingeniero de datos debe saber now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.