Capítulo 12. El problema de la selección de experimentos (y una solución)

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En es difícil imaginar un sistema a gran escala del mundo real que no implique la interacción de personas y máquinas. Cuando diseñamos un sistema de este tipo, a menudo lo más difícil (e importante) es averiguar cómo utilizar mejor los dos tipos diferentes de recursos. En este capítulo, defiendo que la comunidad de la resiliencia debería replantearse cómo aprovecha a las personas y a los ordenadores como recursos. Concretamente, sostengo que el problema de desarrollar intuiciones sobre los modos de fallo del sistema utilizando la infraestructura de observabilidad, y en última instancia descargar esas intuiciones en forma de experimentos de caos, es una función que desempeña mejor un ordenador que una persona. Por último, aporto algunas pruebas de que la comunidad está preparada para avanzar en esta dirección.

Elegir experimentos

Independiente de (y complementario a) las metodologías tratadas en el resto del libro es el problema de la selección de experimentos: elegir qué fallos inyectar en qué ejecuciones del sistema. Como hemos visto, elegir los experimentos adecuados puede significar identificar fallos antes de que lo hagan nuestros usuarios, así como aprender cosas nuevas sobre el comportamiento de nuestro sistema distribuido a escala. Por desgracia, debido a la complejidad ...

Get Ingeniería del caos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.