Część III Praktyki

W prostym ujęciu zespoły SRE kierują usługami — zbiorem powiązanych systemów dla wewnętrznych lub zewnętrznych użytkowników — i ostatecznie odpowiadają za ich stan. Skuteczne zarządzanie usługą wymaga wielu czynności: tworzenia systemów monitorowania, planowania przepustowości, reagowania na incydenty, zapewniania, że podstawowe przyczyny przestojów zostaną uwzględnione itd. W tej części omawiamy teorię i praktykę codziennej pracy zespołów SRE: budowanie dużych rozproszonych systemów obliczeniowych i zarządzanie nimi.

Stan usługi można scharakteryzować podobnie jak zrobił to Abraham Maslow w stosunku do potrzeb człowieka [Mas43], zaczynając od najbardziej podstawowych wymogów niezbędnych do działania systemu w formie usługi, ...

Get Site Reliability Engineering now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.