Autorzy: Raymond Blum i Rhandeev SinghRedakcja: Betsy BeyerŚcisłe wymagania z zakresu integralności danychWybór strategii zapewniania wysokiej integralności danychKopie zapasowe a archiwaWymagania w chmurzeCele zespołów SRE w Google’u w zakresie integralności i dostępności danychIntegralność danych to środek do celu, jakim jest dostępność danychUdostępnianie systemu przywracania danych zamiast systemu tworzenia kopii zapasowychRodzaje awarii prowadzące do utraty danychTrudności z utrzymywaniem integralności danych w głębokim i szerokim zakresieProblemy ze skalowaniem: kopie pełne, kopie przyrostowe oraz różnice między kopiami zapasowymi i przywracaniemRetencjaJak zespoły SRE Google’a radzą sobie z problemami z integralnością danych?Dwadzieścia cztery rodzaje błędów z obszaru integralności danychWarstwa pierwsza — miękkie usuwanieWarstwa druga — kopie zapasowe i powiązane z nimi metody przywracaniaNadrzędna warstwa — replikacja1T a 1E — więcej niż „tylko” większe kopie zapasoweWarstwa trzecia — wczesne wykrywanieTrudności, przed jakimi stoją programiści rozwiązań w chmurzePozaścieżkowe sprawdzanie danychPewność, że przywracanie danych się powiedzieStudia przypadkówGmail, luty 2011 r. — przywracanie z systemu GTapeNiedziela, 27 lutego 2011 r., późny wieczórMuzyka Google, marzec 2012 r. — wykrycie niekontrolowanego usuwania danychWtorek, 6 marca 2012 r., popołudnieWykrycie problemuAnaliza szkódRozwiązywanie problemuEliminowanie przyczyny źródłowejOgólne zasady SRE stosowane w obszarze integralności danychUmysł początkującegoUfaj, ale kontrolujPosiadanie nadziei nie jest strategiąObrona w głąbWnioski