book

Base de données interne

by Alex Petrov

November 2024

Intermediate to advanced

376 pages

12h 13m

French

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Comment nous contacter
Architecture du SGBDSGBD à mémoire ou à disqueDurabilité des magasins à mémoireSGBD orientés colonnes ou lignesDisposition des données orientée vers les lignesDisposition des données en colonnesDistinctions et optimisationsMagasins à colonnes largesFichiers de données et fichiers d'indexFichiers de donnéesFichiers d'indexL'index primaire en tant qu'indicationMise en mémoire tampon, immuabilité et ordonnancementRésumé
Arbres de recherche binairesÉquilibrage des arbresArbres pour le stockage sur disqueStructures sur disqueDisques dursDisques d'état solidesStructures sur disqueArbres B omniprésentsHiérarchie B-TreeTouches de séparationComplexité de la recherche dans l'arbre BAlgorithme de recherche B-TreeClés de comptageSéparation des nœuds de l'arbre BFusions de nœuds de l'arbre BRésumé
MotivationCodage binaireTypes primitifsChaînes de caractères et données de taille variableDonnées emballées au bit près : Booléens, Enums et DrapeauxPrincipes générauxStructure de la pagePages fenduesDisposition des cellulesCombiner des cellules dans des pages à fentesGestion des données de taille variableVersionnementSomme de contrôleRésumé
En-tête de pageChiffres magiquesLiens entre frères et sœursPointeurs les plus à droiteClés du nœudPages de débordementRecherche binaireRecherche binaire avec pointeurs de directionPropager les scissions et les fusionsChapelureRééquilibrageAppels à droite seulementChargement en vracCompressionAspiration et entretienFragmentation causée par les mises à jour et les suppressionsDéfragmentation des pagesRésumé
Gestion de la mémoire tamponSémantique de la mise en cacheEviction du cacheVerrouiller les pages dans le cacheRemplacement de la pageRécupérationSémantique du journalFonctionnement par rapport à l'enregistrement des donnéesVoler et forcer les politiquesARIESContrôle de la concurenceSérialisationIsolation des transactionsAnomalies de lecture et d'écritureNiveaux d'isolementContrôle optimiste de la concurenceContrôle de la concurence en multiversionContrôle pessimiste de la concurenceContrôle de la concurence basé sur les verrousRésumé
Copie sur l'écritureMise en œuvre de la fonction Copy-on-Write : LMDBAbstraction des mises à jour des nœudsArbres B paresseuxWiredTigerArbre paresseux-adaptatifArbres FDCascade fractionnéeCourses logarithmiquesArbres BwChaînes de mise à jourApprivoiser la simultanéité avec la comparaison et l'échangeOpérations de modification structurelleConsolidation et ramassage des orduresArbres de type B (Cache-Oblivious B-Trees)van Emde Boas Mise en pageRésumé
Arbres LSMStructure de l'arbre des RMLLMises à jour et suppressionsRecherche dans l'arbre LSMFusion-ItérationRapprochementEntretien des arbres LSMLecture, écriture et amplification de l'espaceConjecture RUMDétails de la mise en œuvreTables de cordes triéesFiltres de BloomListe de skiAccès au disqueCompressionStockage LSM non ordonnéBitcaskWiscKeyConcurrence dans les arbres LSMEmpilage de grumesCouche de traduction FlashEnregistrement du système de fichiersLLAMA et l'empilage conscientSSD à canal ouvertRésumé

Exécution simultanéeÉtat partagé dans un système distribuéLes erreurs de l'informatique distribuéeTraitementHorloges et tempsCohérence de l'ÉtatExécution locale et à distanceNécessité de gérer les échecsPartitions du réseau et pannes partiellesDéfaillances en cascadeAbstractions des systèmes distribuésLiensLe problème de deux générauxImpossibilité FLPSynchronisation du systèmeModèles de défaillanceDéfauts d'écrasementFautes d'omissionDéfauts arbitrairesGérer les échecsRésumé
Battements de cœur et PingsDétecteur de défaillance sans délai d'attenteLes battements de cœur externalisésDétecteur de défaillance Phi-AccrualLes ragots et la détection des échecsInversion de la détection des défaillances Énoncé du problèmeRésumé
Algorithme BullyBasculement de ligne suivanteOptimisation des candidats/ordinairesAlgorithme d'invitationAlgorithme en anneauRésumé
Atteindre la disponibilitéInfamous CAPUtilise le CAP avec précautionRécolte et rendementMémoire partagéeCommanderModèles de cohérenceCohérence stricteLinéarisationCohérence séquentielleCohérence causaleModèles de sessionCohérence éventuelleCohérence réglableRépliques de témoinsCohérence éventuelle forte et CRDTsRésumé
Lire la réparationDigest ReadsUn transfert de responsabilité annoncéArbres de MerkleVecteurs de la version bitmapDiffusion de ragotsMécanique des potinsRéseaux superposésPotins hybridesVues partiellesRésumé
Faire apparaître les opérations comme atomiquesEngagement à deux phasesÉchecs de cohortes dans 2PCDéfaillances du coordinateur dans 2PCEngagement triphaséDéfaillances du coordinateur dans 3PCTransactions distribuées avec CalvinTransactions distribuées avec SpannerPartitionnement de la base de donnéesHachage cohérentTransactions distribuées avec PercolatorCoordination ÉvitementRésumé
DiffusionDiffusion atomiqueSynchronie virtuelleZooKeeper Atomic Broadcast (ZAB)PaxosAlgorithme PaxosQuorums à PaxosScénarios d'échecMulti-PaxosPaxos rapidePaxos égalitairePaxos flexibleSolution généralisée au consensusRadeauRôle du chef dans le radeauScénarios d'échecConsensus byzantinAlgorithme PBFTRécupération et point de contrôleRésumé

Content preview from Base de données interne

Chapitre 9. Détection des défaillances

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Si un arbre tombe dans une forêt et que personne n'est là pour l'entendre, est-ce qu'il fait un bruit ?

Auteur inconnu

Sur Pour qu'un système puisse réagir de manière appropriée aux pannes, celles-ci doivent être détectées à temps. Un processus défectueux peut être contacté même s'il n'est pas en mesure de répondre, ce qui augmente les temps de latence et réduit la disponibilité globale du système.

Il est extrêmement difficile de détecter les défaillances dans les systèmes distribués asynchrones (c'est-à-dire sans faire d'hypothèses de temps), car il est impossible de savoir si le processus s'est écrasé ou s'il s'exécute lentement et prend un temps indéfiniment long pour répondre. Nous avons discuté d'un problème lié à celui-ci dans "FLP Impossibility".

Les termes tels que dead, failed et crashed sont généralement utilisés pour décrire un processus qui a complètement cessé d'exécuter ses étapes. Les termes tels que unresponsive, faulty et slow sont utilisés pour décrire des processus suspects, qui peuvent en fait être morts.

Les défaillances peuvent se produire au niveau du lien (les messages entre les processus sont perdus ou transmis lentement), ou au niveau du processus (le processus se bloque ou s'exécute lentement), et la lenteur ne peut pas toujours être distinguée de la défaillance. Cela signifie qu'il ...