Capítulo 13. Copias de seguridad y recuperación tras desastres

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo se describen las preocupaciones en torno a la creación de una estrategia sólida para mantener los datos de un sistema basado en Hadoop seguros y disponibles, de forma que, en caso de pérdida de datos a través de un error del usuario (datos borrados erróneamente) o un desastre (como la pérdida de todo el clúster), se pueda iniciar y completar una restauración. Esta restauración deja a los usuarios del clúster con algún tipo de estado fiable para que puedan proseguir con sus tareas empresariales.

Ten en cuenta que esto es necesario, incluso con la alta disponibilidad (ver Capítulo 12) activada, porque la restauración de datos también se aplica a los problemas que no surgen por mantener un servicio con capacidad de respuesta. Más bien al contrario. Incluso con componentes redundantes en cada nivel de la pila, la pérdida de metadatos o datos puede causar una interrupción que sólo puede mitigarse con una estrategia adecuada de copia de seguridad o recuperación ante desastres, establecida de antemano.

Contexto

Antes de examinar los planteamientos concretos, debemos establecer un contexto.

Muchos sistemas distribuidos

Hadoop es un sistema complejo, compuesto por muchos proyectos de código abierto que trabajan conjuntamente para construir una plataforma única de procesamiento de datos. Es ...

Get Arquitectura de plataformas de datos modernas now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.