Capítulo 7. Trabajar con datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Uno de los mayores cambios de paradigma al trabajar con la computación en nube es el almacenamiento casi ilimitado del que ahora disponen los usuarios. El almacenamiento blob barato y escalable en forma de Google Cloud Storage (GCS) permite a los administradores empezar desde el punto de vista de "no borrar nunca los datos". Servicios como BigQuery y Spark en Dataproc te permiten pagar por el almacenamiento de larga duración independientemente de los recursos informáticos, que pagas por segundos. Generalmente, la computación es más cara que el almacenamiento, por lo que este paradigma ahorra una gran cantidad de esfuerzo de ingeniería tratando de mover, archivar y recuperar datos entre sistemas de almacenamiento dispares.

Las recetas de este capítulo muestran consejos y trucos a la hora de trabajar con las distintas capas de datos de Google Cloud, desde mover datos por los buckets GCS más rápidamente, hasta archivar automáticamente datos a largo plazo, pasando por algunas técnicas más avanzadas de bases de datos.

Todos los ejemplos de código de este capítulo están en el repositorio GitHub de este libro. Puedes seguirlos y copiar el código de cada receta yendo a la carpeta con el número de esa receta.

7.1 Acelerar las transferencias masivas de almacenamiento en la nube mediante multiprocesamiento

Problema

Aunque la herramienta ...

Get Libro de cocina de Google Cloud now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.