Ingegneria dell'affidabilità dei siti
by Niall Richard Murphy, Betsy Beyer, Chris Jones, Jennifer Petoff
Capitolo 23. Gestione dello stato critico: Consenso distribuito per l'affidabilità
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
I processi si bloccano o devono essere riavviati. I dischi rigidi si guastano. I disastri naturali possono mettere fuori uso diversi datacenter in una stessa regione. Gli ingegneri dell'affidabilità dei siti devono prevedere questo tipo di guasti e sviluppare strategie per mantenere i sistemi in funzione nonostante essi. Queste strategie di solito implicano la gestione dei sistemi in più siti. Distribuire geograficamente un sistema è relativamente semplice, ma introduce anche la necessità di mantenere una visione coerente dello stato del sistema, un'impresa più complicata e ricca di sfumature.
I gruppi di processi possono voler concordare in modo affidabile su domande come:
-
Quale processo è il leader di un gruppo di processi?
-
Qual è l'insieme dei processi di un gruppo?
-
Un messaggio è stato impegnato con successo in una coda distribuita?
-
Un processo ha un contratto di locazione o no?
-
Qual è il valore di un datastore per una determinata chiave?
Abbiamo scoperto che il consenso distribuito è efficace per costruire sistemi affidabili e altamente disponibili che richiedono una visione coerente di alcuni stati del sistema. Il problema del consenso distribuito riguarda il raggiungimento di un accordo tra un gruppo ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access