Capítulo 14. Al principio, el caos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Los servicios se caen y la gente lo pasa mal. Los clientes que dependen del servicio se frustran, otros sistemas que dependen del servicio dejan de funcionar y se llama a los responsables del sistema. La historia sugiere1 que incluso los servicios en línea más célebres son vulnerables a las caídas, incluso con cientos y a veces miles de personas dedicadas a su funcionamiento y tiempo de actividad. A medida que el software aumenta inexorablemente en complejidad2 los viejos métodos de prevención de errores y fallos resultan insuficientes.

En un pasado no tan lejano, las buenas prácticas en torno a las pruebas, el estilo del código y el proceso nos daban la confianza de que el código que escribíamos e implementábamos haría lo que esperábamos que hiciera. Creemos que prácticas como las pruebas rigurosas, el desarrollo basado en pruebas (TDD), los bucles de retroalimentación ágiles, la programación por parejas y muchas otras pueden ayudar a reducir los errores a largo plazo. Prácticas como éstas siguen siendo muy importantes, pero no son suficientes para la ingeniería de sistemas complejos modernos.

Se necesitan nuevas buenas prácticas que nos devuelvan la confianza en los sistemas que construimos. Están surgiendo buenas prácticas para satisfacer esta necesidad, y la ingeniería del caos ...

Get Buscando SRE now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.