book

设计数据密集型应用程序

by Martin Kleppmann

May 2025

Beginner to intermediate

616 pages

7h 31m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

谁应该阅读这本书？本书的范围本书概要参考文献和进一步阅读O'Reilly 在线学习如何联系我们致谢
思考数据系统可靠性硬件故障软件错误人为错误可靠性有多重要？可扩展性描述负载描述性能减轻负担的方法可维护性可操作性：让操作更轻松简单：管理复杂性进化性：让变革变得简单摘要
关系模型与文档模型NoSQL 的诞生对象-关系错配多对一和多对多关系文档数据库是否在重复历史？关系数据库与当今的文档数据库数据查询语言网络上的声明式查询MapReduce 查询类图数据模型属性图赛弗尔查询语言SQL 中的图形查询三重存储和 SPARQL基金会：数据目录摘要
为数据库提供动力的数据结构散列索引SSTables 和 LSM-TreesB 树比较 B 树和 LSM 树其他索引结构交易处理还是分析？数据仓库Stars and Snowflake：分析模式列导向存储立柱压缩列存储中的排序顺序写入面向列的存储聚合：数据立方体和物化视图摘要
数据编码格式特定语言格式JSON、XML 和二进制变体节俭和协议缓冲区Avro模式的优点数据流模式数据库中的数据流通过服务实现数据流：REST 和 RPC消息传递数据流摘要
领导者和追随者同步复制与异步复制设置新关注者处理节点中断复制日志的实施复制滞后问题阅读自己的作品单调阅读一致的前缀读取复制滞后的解决方案多线索复制多领导复制用例处理写入冲突多引线复制拓扑无领导复制节点宕机时向数据库写入数据法定人数一致性的限制马虎的法定人数和暗示的移交检测并发写入摘要
分区和复制键值数据分区按键范围分区按密钥哈希值分区倾斜的工作量和缓解热点问题分区和二级索引按文档划分二级索引按术语划分二级索引重新平衡分区重新平衡战略操作：自动或手动再平衡请求路由并行查询执行摘要
交易的模糊概念ACID 的含义单对象和多对象操作弱隔离级别阅读已承诺快照隔离和可重复读取防止丢失更新书写偏斜和幻影序列化实际串行执行两相锁定 (2PL)可序列化快照隔离（SSI）摘要

故障和部分故障云计算和超级计算不可靠的 Network+网络故障实践检测故障超时和无界延迟同步网络与异步网络不可靠的时钟单调钟与授时钟时钟同步和精度依靠同步时钟进程暂停知识、真理与谎言真理由多数人定义拜占庭故障系统模型与现实摘要
一致性保证线性化什么使系统可线性化？依赖线性化实现可线性化系统线性化的代价订购保证有序性和因果性序列号排序订单广播总量分布式事务和共识原子提交和两阶段提交 (2PC)分布式交易实践容错共识会员和协调服务摘要
使用 Unix 工具进行批处理简单日志分析Unix 哲学MapReduce 和分布式文件系统执行 MapReduce 作业还原边连接和分组地图侧连接批处理工作流程的输出Hadoop 与分布式数据库的比较超越 MapReduce中间状态的具体化图形和迭代处理高级应用程序接口和语言摘要
传输事件流信息传递系统分区日志数据库和数据流保持系统同步变更数据采集活动采购状态、流和不变性处理流流处理的用途关于时间的推理加入流媒体容错摘要
数据整合通过获取数据组合专业工具批处理和流处理拆分数据库组成数据存储技术围绕数据流设计应用程序观察衍生状态力求正确数据库的端到端论证执行限制及时性和完整性信任，但要核实做正确的事预测分析隐私和跟踪摘要

Content preview from 设计数据密集型应用程序

第 9 章一致性与共识一致性与共识

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

是活着却错了，还是正确却死了？

杰伊-克雷普斯，《关于卡夫卡和杰普逊的几点说明》（2013 年）

正如第 8 章所讨论的，分布式系统中可能会出现很多问题。处理此类故障的最简单方法就是让整个服务失效，并向用户显示错误信息。如果无法接受这种解决方案，我们就需要找到容错的方法，也就是说，即使某些内部组件出现故障，也能保持服务正常运行。

在本章中，我们将举例说明构建容错分布式系统的算法和协议。我们将假设第 8 章中的所有问题都可能发生：数据包可能丢失、重新排序、重复或在网络中任意延迟；时钟充其量只是近似值；节点可能随时暂停（如由于垃圾回收）或崩溃。

构建容错系统的最佳方法是找到一些具有有用保证的通用抽象，将其实现一次，然后让应用程序依赖这些保证。这与我们在第 7 章中使用事务的方法相同：通过使用事务，应用程序可以假装没有崩溃（原子性）、没有其他人并发访问数据库（隔离性）以及存储设备完全可靠（耐用性）。即使崩溃、竞赛条件和磁盘故障确实会发生，事务抽象也会隐藏这些问题，因此应用程序无需担心。

现在，我们将继续沿着同样的思路，寻找能让应用程序忽略分布式系统中某些问题的抽象概念。例如，分布式系统最重要的抽象之一是共识：即让所有节点就某些事情达成一致。我们将在本章中看到，在网络故障和进程失败的情况下可靠地达成共识是一个令人惊讶的棘手问题。

一旦实现了共识，应用程序就可以将其用于各种目的。例如，假设你有一个使用单领导复制的数据库。如果领导者死亡，需要故障切换到另一个节点，剩余的数据库节点可以使用共识来选举新的领导者。正如"处理节点中断 "中所讨论的，重要的是只有一个领导者，而且所有节点都同意谁是领导者。如果两个节点都认为自己是领导者，这种情况就叫做 "大脑分裂"，通常会导致数据丢失。共识的正确实现有助于避免此类问题。

在本章后面的"分布式事务和共识 "部分，我们将研究解决共识和相关问题的算法。但我们首先需要探索分布式系统中可以提供的各种保证和抽象。

我们需要了解哪些事情可以做，哪些事情不可以做：在某些情况下，系统可以容忍故障并继续工作；而在另一些情况下，则不可能做到这一点。关于哪些事情可以做，哪些事情不可以做，在理论证明和实际应用中都有过深入探讨。我们将在本章概述这些基本限制。

几十年来，分布式系统领域的研究人员一直在研究这些主题，因此有很多资料--我们只能触及表面。在本书中，我们没有篇幅详述形式化模型和证明，因此我们将坚持非正式的直觉。如果你感兴趣，文献参考可提供大量更深入的内容。

一致性保证

在"复制滞后的问题 "中，我们探讨了复制数据库中出现的一些时间问题。如果在同一时刻查看两个数据库节点，很可能会在两个节点上看到不同的数据，因为写入请求在不同的时间到达不同的节点。无论数据库使用哪种复制方法（单领导、多领导或无领导复制），都会出现这些不一致。

大多数复制数据库至少提供最终一致性，这意味着如果停止向数据库写入数据并等待一段未指定的时间，那么最终所有读取请求都会返回相同的值[1]。换句话说，不一致性是暂时的，最终会自行解决（假设网络中的任何故障最终也会修复）。最终一致性的更好名称可能是 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341656581Supplemental Content

设计数据密集型应用程序

by Martin Kleppmann

第 9 章一致性与共识一致性与共识

一致性保证

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Python设计模式（第2版）

Kafka权威指南（第2版）

超越Vibe编程

雷达趋势观察：2025年7月

Publisher Resources

第 9 章 一致性与共识 一致性与共识

一致性保证

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Python设计模式（第2版）

Kafka权威指南（第2版）

超越Vibe编程

雷达趋势观察：2025年7月

Publisher Resources

第 9 章一致性与共识一致性与共识

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.