Capítulo 17. Trabajar con grandes bases de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los primeros tiempos de las bases de datos relacionales, la capacidad del disco duro se medía en megabytes, y las bases de datos eran generalmente fáciles de administrar simplemente porque no podían hacerse muy grandes. Hoy, sin embargo, la capacidad de los discos duros se ha disparado hasta los 15 TB, una moderna matriz de discos puede almacenar más de 4 PB de datos, y el almacenamiento en la nube es esencialmente ilimitado. Aunque las bases de datos relacionales se enfrentan a varios retos a medida que los volúmenes de datos siguen creciendo, existen estrategias como la partición, la agrupación en clústeres y la fragmentación que permiten a las empresas seguir utilizando bases de datos relacionales repartiendo los datos entre varios niveles de almacenamiento y servidores. Otras empresas han decidido pasar a plataformas de big data, como Hadoop, para manejar enormes volúmenes de datos. Este capítulo examina algunas de estas estrategias, haciendo hincapié en las técnicas para escalar bases de datos relacionales .

Partición

¿Cuándo exactamente una tabla de base de datos se vuelve "demasiado grande"? Si haces esta pregunta a 10 arquitectos/administradores/desarrolladores de datos distintos, probablemente obtendrás 10 respuestas diferentes. Sin embargo, la mayoría de la gente estará de acuerdo en que las siguientes ...

Get Aprender SQL, 3ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.