Capítulo 10. Aprender del fracaso
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hay muchas prácticas de SRE en este libro, pero ésta es la única que recibe su propio capítulo. Aprender del fracaso está en el nexo de una práctica activa de SRE que pretende conducirnos al nivel adecuado de fiabilidad que deseamos. Para explicarlo mejor, veamos los caminos que se encuentran en esta encrucijada.
En primer lugar, tienes el monitoreo/observabilidad, descritos anteriormente como las cosas más cruciales que hay que tener sólidamente asentadas al comenzar tu trabajo de fiabilidad. Esos datos nos dan claridad sobre el estado actual de nuestros sistemas, el qué es.
En segundo lugar, tienes procesos de planificación del trabajo como los SLI/SLO, que nos permiten especificar con un grado razonable de claridad nuestras intenciones y objetivos de lo que debería ser.
Y, por último, tienes los incidentes/interrupciones (con las prácticas de respuesta que los acompañan). Proporcionan (nos guste o no) datos sobre cómo lo que es puede desviarse o se ha desviado de lo que debería ser.
Las prácticas en torno al aprendizaje del fracaso se sitúan en esta encrucijada. Nos permiten crear y alimentar los bucles de retroalimentación que nos ayudarán a iterar desde donde estamos hasta donde queremos estar, utilizando la información que tenemos de cómo nos hemos desviado. Pero eso sólo ocurre si somos intencionados, de ahí este capítulo. ...
Get Convertirse en SRE now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.