Capítulo 10. Aprende com o fracasso
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Há muitas práticas de SRE neste livro, mas esta é a única que tem o seu próprio capítulo. Aprender com o fracasso é o nexo de uma prática SRE ativa que procura levar-nos ao nível adequado de fiabilidade que desejamos. Para explicar melhor, vamos olhar para as estradas que se encontram nesta encruzilhada.
Em primeiro lugar, tens a monitorização/observabilidade - anteriormente descrita como a coisa mais crucial para se ter solidamente implementada quando se inicia o trabalho de fiabilidade. Esses dados dão-nos clareza sobre o estado atual dos nossos sistemas, o que é.
Em segundo lugar, tens os processos de planeamento do trabalho, como os SLIs/SLOs, que nos permitem especificar com um grau razoável de clareza as nossas intenções e objectivos para o que deve ser.
E, finalmente, tens os incidentes/interrupções (com as práticas de resposta que os acompanham). Estes fornecem (quer queiramos quer não) dados sobre a forma como o que existe pode divergir ou divergiu do que deveria existir.
As práticas em torno da aprendizagem com o fracasso situam-se nesta encruzilhada. Permitem-nos criar e alimentar os ciclos de feedback que nos ajudarão a iterar de onde estamos para onde queremos estar, utilizando a informação que temos sobre como divergimos. Mas isso só acontece se formos intencionais, daí este capítulo.
Falar sobre o fracasso
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access