Capítulo 14. Gestión de incidencias

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Una gestión eficaz de los incidentes es clave para limitar las perturbaciones causadas por un incidente y restablecer el funcionamiento normal de la empresa lo antes posible. Si no has preparado de antemano tu respuesta a posibles incidentes, una gestión de incidentes basada en principios puede fracasar en situaciones reales.

Este capítulo recorre el retrato de un incidente que se descontrola debido a prácticas ad hoc de gestión de incidentes, esboza un enfoque bien gestionado del incidente y revisa cómo podría haberse desarrollado el mismo incidente si se hubiera gestionado con un buen funcionamiento de la gestión de incidentes.

Incidentes no gestionados

Ponte en la piel de María, la ingeniera de guardia de La Firma. Son las 2 de la tarde de un jueves y tu busca acaba de explotar. El monitoreo de la caja negra te dice que tu servicio ha dejado de servir tráfico en todo un centro de datos. Con un suspiro, dejas el café y te pones manos a la obra para arreglarlo. A los pocos minutos de empezar la tarea, otra alerta te dice que un segundo centro de datos ha dejado de servir. Luego falla el tercero de tus cinco centros de datos. Para agravar la situación, hay más tráfico del que pueden soportar los restantes centros de datos, por lo que empiezan a sobrecargarse. Antes de ...

Get Ingeniería de Fiabilidad del Sitio now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.