Prefacio

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

¿Tiene tu empresa incidencias informáticas?

¿Has tenido alguna vez un incidente informático de gran gravedad que haya interrumpido el servicio que tus clientes confían en que les prestes?

¿Ese incidente dañó la reputación de tu empresa, erosionó la confianza de tus clientes o inversores, o creó un impacto empresarial o financiero adverso?

¿La respuesta y resolución del incidente fueron lentas, desorganizadas o mal gestionadas?

Si has respondido "Sí" a alguna de estas preguntas, hazte otra más: ¿estás contento con la forma en que tu empresa responde actualmente a los incidentes informáticos? Si la respuesta es "No", entonces debes estar buscando una forma mejor, y este libro se ha escrito para ti.

Te mostraremos una nueva forma de pensar sobre la respuesta y la resolución de incidentes informáticos. Esta nueva forma funciona tanto en pequeños equipos DevOps como en las mayores empresas y organizaciones proveedoras de servicios. Colectivamente, tenemos más de 100 años de experiencia en el mando de incidentes dirigiendo equipos de operaciones especiales en concurridos cuerpos de bomberos urbanos de las costas este y oeste y gestionando infraestructuras críticas en todo Estados Unidos. También tenemos experiencia especializada en gestión de incidentes en más de 40 países, en los más altos niveles del gobierno y la industria. En este libro, identificamos las buenas prácticas de fuera de la industria de TI que han sido sometidas literalmente a la prueba del fuego, y aplicamos la misma metodología de respuesta a incidentes al mundo de las operaciones de TI.

¿Cómo y por qué dimos el salto del servicio de bomberos a las TI? En otoño de 2012, a sugerencia de Jesse Robbins (ver Prólogo), el adoptador original del uso de tácticas y estrategias IMS en TI, nos reunimos con un selecto grupo de profesionales de TI que eran responsables del tiempo de actividad en grandes empresas de medios sociales y otras operaciones web a gran escala. El objetivo de la reunión era debatir y comprender mejor los retos a los que se enfrentan las empresas de TI a la hora de resolver incidencias informáticas. Estos profesionales de TI querían buscar fuera de su sector una forma mejor, porque los modelos internos del sector no funcionaban bien. Querían saber cómo gestionan los bomberos los incidentes urgentes en los que hay mucho en juego, el entorno de toma de decisiones es deficiente, las condiciones cambian y los resultados son inciertos.

A medida que avanzaba el debate, el grupo reconoció las sorprendentes similitudes entre los incidentes urgentes de seguridad pública que requieren una respuesta de los bomberos y los incidentes tecnológicos urgentes que requieren una respuesta de TI. De hecho, los primeros informáticos que responden a una interrupción del servicio o a un ataque de ciberseguridad son los "primeros en responder", igual que los primeros bomberos en la escena de un incendio. Al final de la reunión, todos estuvimos de acuerdo en que había grandes oportunidades de trasladar las mejores partes del SGI de seguridad pública, sobre todo en lo que se refiere a la dirección de personas y la gestión del tiempo, directamente al sector de las TI. Los principios son los mismos y directamente aplicables al tipo de incidentes de alta gravedad/prioridad que experimenta la industria de TI.

"Hace unos años, buscamos una forma mejor de gestionar los incidentes en Salesforce", dice Kwesi Ames, Vicepresidente de Ingeniería de Fiabilidad de la empresa. "Al adaptar los principios de IMS, el mismo sistema que utilizan los bomberos, vimos una enorme mejora en la respuesta a incidentes tecnológicos críticos. Fue un verdadero cambio de juego para nosotros", subrayó. "Nos proporcionó una plantilla disciplinada que nos permitió ser siempre eficientes en la respuesta y la gestión de problemas importantes en nuestro entorno de producción. Esto se ha traducido en tiempos de recuperación más rápidos y ha minimizado la pérdida de confianza de los clientes."

El IMS establece el marco de la respuesta a incidentes y las normas de comportamiento de quienes responden a ellos. Los sucesos de alta gravedad/prioridad someten a los responsables de la respuesta a incidentes a una presión de tiempo crítica para resolver los incidentes informáticos cuando están en juego la confianza de los clientes, impactos financieros adversos y la reputación de la empresa. Utilizar IMS aumenta tus posibilidades de obtener un buen resultado y proteger el negocio de la empresa.

Es un hecho que el futuro de la informática promete más escala, más complejidad y, sin duda, más cambios, todo ello a una velocidad cada vez mayor. También es cierto que cada día aumentan las probabilidades de que tu organización sufra un incidente tecnológico importante, creado interna o externamente.

Sin una forma predecible de responder a los incidentes, cualquier organización -en crecimiento o madura- está en peligro. Torsten Rueter, director de servicios de plataforma global de GE Capital, lo ve así: "Marcos como ITIL han ayudado a madurar las operaciones de TI a gran escala. El Sistema de Gestión de Incidentes aborda algunos de los aspectos más sutiles -aunque extremadamente importantes- de la gestión de incidentes. Sin un liderazgo fuerte, colaboración y pautas de trabajo compartidas, un Equipo de Respuesta a Incidentes no alcanzará todo su potencial."

Basándonos en el trabajo de Jesse Robbin, adaptamos el Sistema de Gestión de Incidentes (SGI) de la seguridad pública a los entornos informáticos corporativos. Incorporamos el IMS a las prácticas ITIL, DevOps, Agile y Lean. Colaboramos con los clientes para crear una cultura de respuesta a incidentes.

Aportamos un punto de vista único al sector de las TI. Colectivamente, aportamos más de 100 años de experiencia en servicios de bomberos e infraestructuras críticas a la gestión de incidentes de TI. Combinamos nuestra profunda experiencia global en respuesta a incidentes de incendios, materiales peligrosos (HazMat), armas de destrucción masiva (ADM) y contraterrorismo con redes de fibra, centros de datos, petróleo y gas, energía y mercados de capitales para mejorar el rendimiento de la gestión de incidentes.

Nuestros clientes generan 400.000 millones de dólares de ingresos y crean 1 billón de dólares de capitalización bursátil, al tiempo que emplean a más de 850.000 personas en todo el mundo. Estas empresas se encuentran entre el 10% de los primeros puestos de las listas Fortune 500 y PwC Global 100 Software Leaders, y operan globalmente en los sectores de la industria, los servicios financieros, los productos de consumo, las telecomunicaciones y el software, atendiendo a mercados de Norteamérica, Europa, Oriente Medio, África, Asia y el Pacífico.

El asesoramiento, la formación, la evaluación y los ejercicios son el mejor predictor del rendimiento futuro. Hemos impartido nuestros programas de gestión de incidentes en tres continentes y en nueve países a miles de Comandantes de Incidentes (CI), expertos en la materia (SME), ejecutivos y personal corporativo. Trabajan en equipos de fiabilidad de instalaciones, ciberseguridad, apoyo a misiones críticas, mando unificado, TI empresarial, operaciones, I+D e ingeniería/tecnología (red, base de datos, SAN/Almacenamiento, servidor, automatización, aplicaciones), jurídico, comunicaciones de crisis y dirección ejecutiva. Esos equipos trabajan en centros de mando globales, centros de operaciones de emergencia, centros de operaciones regionales, salas de guerra y salas de juntas de algunas de las mayores empresas que gestionan las mayores pilas tecnológicas del mundo. Maximizamos el tiempo de actividad durante incidentes informáticos de alta gravedad.

Este libro te mostrará una buena práctica en gestión de incidentes para el sector de TI, aunque provenga de fuera del sector de TI. Ofreceremos no sólo una forma mejor de pensar en la respuesta a incidentes, sino una mirada al interior de las técnicas de IMS probadas en batalla y utilizadas en otras organizaciones de TI y en todo el servicio de bomberos de Estados Unidos para organizar, dirigir y resolver situaciones de vida o muerte. Ofreceremos las mismas ideas, perspectivas y consejos que ayudaron a una empresa de servicios financieros del Fortune 50 a reducir su Tiempo Medio de Reparación (MTTR) en un 35%. Además, hablaremos de casos de uso representativos de algunos de los equipos de operaciones de TI más grandes (y algunos de los más pequeños) del mundo.

Hay una forma mejor de responder a los incidentes, y acabas de encontrarla.

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Safari O'Reilly

Nota

Safari (antes Safari Books Online) es una plataforma de formación y referencia basada en membresías para empresas, administraciones públicas, educadores y particulares.

Los miembros tienen acceso a miles de libros, vídeos de formación, rutas de aprendizaje, tutoriales interactivos y listas de reproducción de más de 250 editoriales, como O'Reilly Media, Harvard Business Review, Prentice Hall Professional, Addison-Wesley Professional, Microsoft Press, Sams, Que, Peachpit Press, Adobe, Focal Press, Cisco Press, John Wiley & Sons, Syngress, Morgan Kaufmann, IBM Redbooks, Packt, Adobe Press, FT Press, Apress, Manning, New Riders, Jones & Bartlett y Course Technology, entre otras. Sons, Syngress, Morgan Kaufmann, IBM Redbooks, Packt, Adobe Press, FT Press, Apress, Manning, New Riders, McGraw-Hill, Jones & Bartlett y Course Technology, entre otras.

Para más información, visita http://oreilly.com/safari.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Norte
  • Sebastopol, CA 95472
  • 800-998-9938 (en Estados Unidos o Canadá)
  • 707-829-0515 (internacional o local)
  • 707-829-0104 (fax)

Para hacer comentarios o preguntas técnicas sobre este libro, envía un correo electrónico a

Para más información sobre nuestros libros, cursos, conferencias y noticias, consulta nuestro sitio web en http://www.oreilly.com.

Encuéntranos en Facebook: http://facebook.com/oreilly

Síguenos en Twitter: http://twitter.com/oreillymedia

Míranos en YouTube: http://www.youtube.com/oreillymedia

Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en http://shop.oreilly.com/product/0636920036159.do

Agradecimientos

Los autores desean dar las gracias al personal de O'Reilly Media por todo su apoyo y ayuda, especialmente a Brian Anderson, que nos guió a lo largo del proceso. Además, los autores quieren dar las gracias a Jesse Robbins, que tuvo la previsión y la visión de llevar los conceptos IMS al mundo de las TI. Además de ser un amigo maravilloso, nos ha proporcionado una enorme cantidad de consejos y asesoramiento a cada uno de nosotros, por lo que le estamos muy agradecidos. Otra persona que tuvo un valor incalculable en el desarrollo de este texto fue Andrea Walter, que nos hizo la edición y el formateo iniciales. Tuvo la ardua tarea de plasmar nuestros pensamientos en este texto. Tom Welch, Jefe de Bomberos del área de la Bahía de San Francisco, participó en el texto, aportando ideas y comentarios sobre el contenido desde la perspectiva del servicio de bomberos. También queremos dar las gracias a nuestros revisores, que nos orientaron para mejorar este texto: Jason Hand y John Allspaw. Ashley y Amber Vidal aportaron ediciones y comentarios sinceros, que ayudaron también a racionalizar y explicar nuestros puntos en un inglés sencillo. También debemos dar las gracias a nuestros clientes y a los miles de informáticos a los que hemos formado y con los que hemos interactuado en todo el mundo. Ellos contribuyen a esto tanto como nosotros, ya que sus experiencias, retos y éxitos se recogen en las páginas de este libro.

Get Gestión de Incidentes para Operaciones now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.