Prefacio

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Cuando escribimos el libro original Site Reliability Engineering, teníamos un objetivo: explicar la filosofía y los principios de la ingeniería y las operaciones de producción en Google. El libro era nuestro intento de compartir las buenas prácticas y lecciones de nuestros equipos con el resto del mundo informático. Supusimos que el libro SRE podría resultar atractivo para un número modesto de ingenieros que trabajasen en grandes empresas preocupadas por la fiabilidad, y que tanto la cantidad como el enfoque del contenido tenderían a limitar el atractivo del libro.

Resultó que estábamos felizmente equivocados en ambos aspectos.

Para nuestra sorpresa y deleite, el libro SRE fue un éxito de ventas en informática durante un período estimulante tras su publicación, y no sólo se vendía o descargaba, sino que se leía. Recibimos preguntas de todo el mundo sobre el libro, el equipo, las prácticas y los resultados. Nos pidieron que habláramos sobre capítulos, enfoques e incidentes. Nos encontramos en la inesperada situación de tener que rechazar peticiones externas porque nos habíamos quedado sin ciclos.

Como la mayoría de las catástrofes del éxito, el libro de las SRE creó la oportunidad de responder con esfuerzo humano ("¡Contrata a más gente! ¡Haz más conferencias!") o con algo más escalable. Y siendo SRE, a pocos lectores les sorprenderá que nos inclináramos por este último enfoque. Decidimos escribir un segundo libro de SRE, uno que ampliara el contenido sobre el que nos pedían que habláramos con más frecuencia y que abordara las preguntas más comunes que los lectores tenían sobre el primer libro.

De las muchas preguntas, peticiones y comentarios que recibimos sobre el primer libro de la ESR, dos temas nos parecieron especialmente interesantes; si no se abordaban, constituían obstáculos para hacer un uso productivo de las lecciones de la ESR. Estos temas se resumen coloquialmente como:

  • Los principios son interesantes, pero ¿cómo los pongo en práctica en mi proyecto/equipo/empresa?

  • El enfoque de SRE no funcionaría para mí; sólo es factible en la cultura de Google, y sólo tiene sentido a la escala de Google.

El propósito de este segundo libro de SRE es (a) añadir más detalles de implementación a los principios esbozados en el primer volumen, y (b) disipar la idea de que la SRE sólo es implementable a "escala Google" o en la "cultura Google".

Este volumen es un complemento de la obra anterior, no una nueva versión. Los dos libros deben tomarse juntos como un par. Aprovecharás al máximo este libro si ya estás familiarizado con su predecesor. El primer libro sobre la ESR está disponible gratuitamente en Internet.

Por su diseño, la estructura de este libro sigue aproximadamente la estructura del primer volumen. Queremos que puedas leer los capítulos en tándem. Cada capítulo de este volumen supone que estás familiarizado con su homólogo de la obra anterior; nuestro objetivo es permitirte ir y venir entre los principios y la práctica a medida que avanzas. De ese modo, podrás utilizar ambos volúmenes como referencias continuas.

A continuación, unas palabras sobre el ethos: algunos lectores nos dijeron que, al describir el viaje de Google hacia mejores operaciones, nos concentrábamos demasiado sólo en nosotros. Algunos lectores sugirieron que estábamos demasiado alejados de los aspectos prácticos del mundo fuera de Google, y no abordamos la interacción de nuestras ideas con los principios de DevOps. Es una crítica totalmente justa que hemos intentado tener en cuenta en este volumen.

Sin embargo, pensamos que la naturaleza altamente opinable de la ESR contribuye a su utilidad como disciplina. Para nosotros eso es una característica, no un error. No defendemos que la ESR sea la única manera (ni siquiera universalmente la mejor) de construir y hacer funcionar sistemas altamente fiables. Sólo es la forma que nos ha dado mejores resultados.

También dedicaremos unas palabras a hablar de cómo se relacionan SRE y DevOps. Lo importante es tener en cuenta que no están en conflicto.

Nos gustaría reconocer por adelantado que este volumen es necesariamente incompleto. La disciplina de la SRE es un campo amplio incluso dentro de los confines de Google, y evoluciona aún más rápido ahora que se practica ampliamente fuera de Google. En lugar de ser amplios y superficiales, hemos centrado este volumen en responder a los detalles de implementación más solicitados del primer volumen.

Por último, este volumen y su predecesor no pretenden ser un evangelio. Por favor, no los trates así. Incluso después de todos estos años, seguimos encontrando condiciones y casos que nos hacen modificar (o, en algunos casos, sustituir) creencias que antes teníamos firmemente arraigadas. La ESR es tanto un viaje como una disciplina.

Esperamos que disfrutes con lo que leas en estas páginas y que el libro te resulte útil. Elaborarlo ha sido una labor de amor. Estamos encantados de que exista una comunidad creciente y capacitada de profesionales de la ESR con la que podamos aprender y mejorar.

Como siempre, agradecemos mucho tus comentarios directos. Nos enseña algo valioso cada vez que lo aportas.

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Constant width

Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.

Constant width bold

Muestra comandos u otros textos que deben ser tecleados literalmente por el usuario.

Constant width italic

Muestra el texto que debe sustituirse por valores proporcionados por el usuario o por valores determinados por el contexto.

Consejo

Este elemento significa un consejo o sugerencia.

Nota

Este elemento significa una nota general.

Advertencia

Este elemento indica una advertencia o precaución.

Utilizar ejemplos de código

El material complementario (ejemplos de código, ejercicios, etc.) se puede descargar en http://g.co/SiteReliabilityWorkbookMaterials.

Este libro está aquí para ayudarte a hacer tu trabajo. En general, si se ofrece código de ejemplo con este libro, puedes utilizarlo en tus programas y documentación. No es necesario que te pongas en contacto con nosotros para pedirnos permiso, a menos que estés reproduciendo una parte importante del código. Por ejemplo, escribir un programa que utilice varios trozos de código de este libro no requiere permiso. Vender o distribuir un CD-ROM de ejemplos de los libros de O'Reilly sí requiere permiso. Responder a una pregunta citando este libro y el código de ejemplo no requiere permiso. Incorporar una cantidad significativa de código de ejemplo de este libro en la documentación de tu producto sí requiere permiso.

Agradecemos, pero no exigimos, la atribución. Una atribución suele incluir el título, el autor, la editorial y el ISBN. Por ejemplo "The Site Reliability Workbook, editado por Betsy Beyer, Niall Richard Murphy, David K. Rensin, Kent Kawahara y Stephen Thorne (O'Reilly). Copyright 2018 Google LLC, 978-1-492-02950-2".

Si crees que el uso que haces de los ejemplos de código no se ajusta al uso legítimo o al permiso concedido anteriormente, no dudes en ponerte en contacto con nosotros en

Safari O'Reilly

Nota

Safari (antes Safari Books Online) es una plataforma de formación y referencia basada en membresías para empresas, administraciones públicas, educadores y particulares.

Los miembros tienen acceso a miles de libros, vídeos de formación, rutas de aprendizaje, tutoriales interactivos y listas de reproducción de más de 250 editoriales, como O'Reilly Media, Harvard Business Review, Prentice Hall Professional, Addison-Wesley Professional, Microsoft Press, Sams, Que, Peachpit Press, Adobe, Focal Press, Cisco Press, John Wiley & Sons, Syngress, Morgan Kaufmann, IBM Redbooks, Packt, Adobe Press, FT Press, Apress, Manning, New Riders, Jones & Bartlett y Course Technology, entre otras. Sons, Syngress, Morgan Kaufmann, IBM Redbooks, Packt, Adobe Press, FT Press, Apress, Manning, New Riders, McGraw-Hill, Jones & Bartlett y Course Technology, entre otras.

Para más información, visita http://oreilly.com/safari.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Norte
  • Sebastopol, CA 95472
  • 800-998-9938 (en Estados Unidos o Canadá)
  • 707-829-0515 (internacional o local)
  • 707-829-0104 (fax)

Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en http://bit.ly/siteReliabilityWkbk.

Para hacer comentarios o preguntas técnicas sobre este libro, envía un correo electrónico a

Para más información sobre nuestros libros, cursos, conferencias y noticias, consulta nuestro sitio web en http://www.oreilly.com.

Encuéntranos en Facebook: http://facebook.com/oreilly

Síguenos en Twitter: http://twitter.com/oreillymedia

Míranos en YouTube: http://www.youtube.com/oreillymedia

Agradecimientos

Este libro es el producto de las entusiastas y generosas contribuciones de más de 100 personas, entre autores, escritores técnicos y revisores. En cada capítulo figura el nombre de cada uno de los autores y redactores técnicos. También nos gustaría dedicar un momento a dar las gracias a todos los que no aparecen en la lista.

Queremos dar las gracias a los siguientes revisores por sus valiosos (y a veces punzantes) comentarios: Abe Hassan, Alex Perry, Cara Donnelly, Chris Jones, Cody Smith, Dermot Duffy, Jarrod Todd, Jay Judkowitz, John T. Reese, Liz Fong-Jones, Mike Danese, Murali Suriar, Narayan Desai, Niccolò Cascarano, Ralph Pearson, Salim Virji, Todd Underwood, Vivek Rau y Zoltan Egyed.

Nos gustaría expresar nuestro más profundo agradecimiento a las siguientes personas por servirnos de barra de calidad general para este volumen. Hicieron contribuciones sustanciales a lo largo de todo el volumen: Alex Matey, Max Luebbe, Matt Brown y JC van Winkel.

Como líderes de Google SRE, Benjamin Treynor Sloss y Ben Lutch fueron los principales patrocinadores ejecutivos de este libro dentro de Google; su firme e inquebrantable creencia en un proyecto de seguimiento que fuera un digno compañero del primer libro de SRE fue esencial para hacer realidad este libro.

Aunque en cada capítulo se menciona específicamente a los autores y redactores técnicos, nos gustaría reconocer a quienes han contribuido a cada capítulo con sus reflexivas aportaciones, debates y revisiones. Por orden de capítulo, son:

  • Capítulo 2: Javier Kohen, Patrick Eaton, Richard Bondi, Yaniv Aknin

  • Capítulo 4: Alex Matey, Clint Pauline, Cody Smith, JC van Winkel, Ola Kłapcińska, Štěpán Davidovič

  • Capítulo 5: Alex Matey, Clint Pauline, Cody Smith, Iain Cooke, JC van Winkel, Štěpán Davidovič

  • Capítulo 6: Dermot Duffy, James O'Keeffe, Stephen Thorne

  • Capítulo 7: Mark Brody

  • Capítulo 8: Alex Perry, Alex Hidalgo, David Huska, Sebastian Kirsch, Sabrina Farmer, Steven Carstensen, Liz Fong-Jones, Nandu Shah (Evernote), Robert Holley (Evernote)

  • Capítulo 9: Alex Hidalgo, Alex Matey, Alex Perry, Dave Rensin, Matt Brown, Tor Gunnar Houeland, Trevor Strohman

  • Capítulo 10: John T. Reese

  • Capítulo 11: Daniel E. Eisenbud, Dave Rensin, Dmitry Nefedkin, Dževad Trumić, Edward Wu (Niantic), JC van Winkel, Lucas Pereira, Luke Stone, Matt Brown, Natalia Sakowska, Niall Richard Murphy, Phil Keslin (Niantic), Rita Sodt, Scott Devoid, Simon Donovan, Tomasz Kulczyński

  • Capítulo 12: Ivo Krka, Matt Brown, Nicky Nicolosi, Tanya Reilly

  • Capítulo 13: Bartosz Janota (Spotify), Cara Donnelly, Chris Farrar, Johannes Rußek (Spotify), Max Charas, Max Luebbe, Michelle Duffy, Nelson Arapé (Spotify), Riccardo Petrocco (Spotify), Rickard Zwahlen (Spotify), Robert Stephenson (Spotify), Steven Thurgood

  • Capítulo 14: Charlene Pérez, Dave Cunningham, Dave Rensin, JC van Winkel, John Reese, Stephen Thorne

  • Capítulo 15: Alex Matey, Bo Shi, Charlene Pérez, Dave Rensin, Eric Johnson, Juliette Benton, Lars Wander, Mike Danese, Narayan Desai, Niall Richard Murphy, Štěpán Davidovič, Stephen Thorne

  • Capítulo 16: Alex Matey, Liz Fong-Jones, Max Luebbe

  • Capítulo 17: Andrew Harvey, Aleksander Szymanek, Brad Kratochvil, Ed Wehrwein, Duncan Sargeant, Jessika Reissland, Matt Brown, Piotr Sieklucki y Thomas Adamcik.

  • Capítulo 18: Brian Balser(New York Times), Deep Kapadia(New York Times), Michelle Duffy, Xavier Llorà

  • Capítulo 19: Matt Brown

  • Capítulo 20: Brian Balser(New York Times), Christophe Kalt, Daniel Rogers, Max Luebbe, Niall Richard Murphy, Ramón Medrano Llamas, Richard Bondi, Steven Carstensen, Stephen Thorne, Steven Thurgood, Thomas Wright

  • Capítulo 21: Dave Rensin, JC Van Winkel, Max Luebbe, Ronen Louvton, Stephen Thorne, Tom Feiner, Tsiki Rosenman

También estamos agradecidos a los siguientes colaboradores, que aportaron conocimientos o recursos significativos, o tuvieron algún otro efecto excelente en este trabajo: Caleb Donaldson, Charlene Pérez, Evan Leonard, Jennifer Petoff, Juliette Benton y Lea Miller.

Agradecemos enormemente los comentarios reflexivos y profundos que hemos recibido de los revisores del sector: Mark Burgess, David Blank-Edelman, John Looney, Jennifer Davis, Björn Rabenstein, Susan Fowler, Thomas A. Limoncelli, James Meickle, Theo Schlossangle, Jez Humble, Alice Goldfuss, Arup Chakrabarti, John Allspaw, Angus Lees, Eric Liang, Brendan Gregg y Bryan Liles.

Nos gustaría expresar un agradecimiento especial a Shylaja Nukala, que dedicó generosamente el tiempo y las habilidades del Equipo de Redacción Técnica del SRE. Apoyó con entusiasmo sus necesarios y valiosos esfuerzos.

Gracias también al equipo de O'Reilly Media -Virginia Wilson, Kristen Brown, Rachel Monaghan, Nikki McDonald, Melanie Yarbrough y Gloria Lukos- por su ayuda y apoyo para hacer realidad el libro en nuestro ambicioso calendario.

Y un agradecimiento muy especial a Niall Richard Murphy: a pesar de que se marchó de Google antes de que este libro llegara a las estanterías, sus continuas ideas y dedicación fueron cruciales para que una buena parte del contenido significativo llegara a la meta. Su liderazgo, consideración, tenacidad e ingenio son sencillamente inspiradores.

Por último, los editores también desean dar las gracias personalmente a las siguientes personas:

  • Betsy Beyer: A la Abuela, mi fuente de ánimo, inspiración, palomitas, ánimo y rompecabezas. ¡Has hecho que tanto este libro como mi vida cotidiana sean mejores! A Duzzie, Hammer, Joan, Kiki y Mini (nótese el orden alfabético, ¡ja!), que me ayudaron a convertirme en la escritora obsesiva y persona que soy hoy. Y, por supuesto, a Riba, por proporcionarme el DMD y otras provisiones necesarias para alimentar este esfuerzo.

  • Niall Richard Murphy: A Léan, Oisín, Fiachra y Kay, estrellas del norte. A alguien cuyas protestas de interés propio no concuerdan en absoluto con su forma de actuar. A Sharon, más influyente de lo que cree. Por Alex, en un salón lleno de luz, con una taza de té, un libro, una caja de dados y tú.

  • Stephen Thorne: A mi madre y mi padre, que siempre me han animado a esforzarme. A mi mujer, Elspeth. A mis colegas, que me han dado más respeto y ánimo del que creo que merezco: Ola, Štěpán, Perry y David.

  • Dave Rensin Después de escribir mi primer libro, juré que nunca escribiría otro. De eso hace ya seis libros y cada vez digo exactamente lo mismo. A mi mujer, Lia, que me da el espacio para hacerlo y nunca me dice "te lo dije". (Aunque ella me lo diga.) A mis colegas de Google -y en particular a la familia de SRE- que me han enseñado más estos últimos años sobre ingeniería de producción a escala de lo que había aprendido en los 20 anteriores. Por último, a Benjamin Treynor Sloss, que me entrevistó y me convenció para venir a Google en primer lugar.

  • Kent Kawahara: A mis padres, Denby y Setsuko, y a mi tía Asako por ayudarme a llegar hasta donde estoy. A mis hermanos, Randy y Patti, por su apoyo a lo largo de los años. A mi mujer, Angela, y a mis hijos, Ryan, Ethan y Brady, por su amor y apoyo. Por último, al equipo central de Dave, Betsy, Niall, Juliette y Stephen, me siento honrado de haber trabajado con vosotros en este proyecto.

Get El cuaderno de trabajo de la fiabilidad del sitio web now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.