Capítulo 2. El monitoreo en un mundo de ingeniería de la fiabilidad
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
El monitoreo de sistemas es un tema extenso que en los últimos años ha sido fuertemente moldeado por el trabajo seminal de Site Reliability Engineering: How Google Runs Production Systems (O'Reilly) y su continuación, The Site Reliability Workbook: Practical Ways to Implement SRE (O'Reilly). Desde que se publicaron estos dos libros en, la ingeniería de fiabilidad de sitios (SRE) se ha convertido en una tendencia popular en las ofertas de empleo. Algunas empresas han llegado a retitular al personal existente como algún tipo de "ingeniería de la fiabilidad".
La ingeniería de fiabilidad de las instalaciones ha cambiado la forma en que los equipos piensan sobre el trabajo operativo. Esto se debe a que consiste en un conjunto de principios que nos permiten responder más fácilmente a preguntas como:
-
¿Proporcionamos una experiencia aceptable al cliente?
-
¿Debemos centrarnos en el trabajo de fiabilidad y resistencia?
-
¿Cómo equilibramos las nuevas funciones con el trabajo?
Este capítulo espera que el lector comprenda en qué consisten estos principios. Si no has leído ninguno de los dos libros mencionados, te recomendamos estos capítulos de The Site Reliability Workbook como curso intensivo:
-
El Capítulo 1 ofrece una comprensión más profunda de la filosofía que subyace a la transición hacia la gestión ...
Get MySQL de Alto Rendimiento, 4ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.