book

设计数据密集型应用程序 (Chinese Edition), 2nd Edition

Name: 设计数据密集型应用程序 (Chinese Edition), 2nd Edition
ISBN: 0642572336233

by Martin Kleppmann, Chris Riccomini

February 2026

Beginner to intermediate

672 pages

7h 53m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
谁应该阅读本书？第二版新增内容？参考文献与延伸阅读本书采用的约定O'Reilly在线学习联系我们鸣谢
1. 数据系统架构中的权衡取舍
运营系统与分析系统交易处理与分析特征描述数据仓库记录系统与衍生数据Cloud Versus Self-HostingCloud服务的优缺点云原生系统架构Cloud时代运维实践分布式系统与单节点系统分布式系统的问题微服务与无服务器架构云计算与超级计算的对比数据系统、法律与社会内容提要
2. 非功能性需求的定义
案例研究：社交网络主页时间轴用户、帖子和关注关系的表示时间线的实例化与更新性能描述延迟与响应时间平均值、中位数与百分位数响应时间指标的应用可靠性与容错性容错性硬件与软件故障人为因素与可靠性可扩展性负载理解共享内存、共享磁盘和无共享架构可扩展性原则可维护性可操作性：让运维更轻松简约性：管理复杂性可演化性：让变更变得简单摘要
3. 数据模型与查询语言
关系模型与文档模型对象-关系不匹配规范化、反规范化与连接多对一与多对多关系星型与Snowflake型：分析型模式何时选用何种模型图式数据模型属性图Cypher查询语言SQL中的图查询三元组存储库与SPARQLDatalog：递归关系查询GraphQL事件溯源与命令查询责任分离数据帧、矩阵与数组摘要
4. 存储与检索
OLTP的存储与索引日志结构化存储B树B树与LSM树的比较多列索引与辅助索引在索引中存储值将所有内容保存在内存中分析型数据存储Cloud数据仓库列式存储查询执行：编译与向量化物化视图与数据立方体多维索引与全文索引全文搜索向量嵌入摘要
5. 编码与演进
数据编码格式特定语言格式JSON、XML 和二进制变体协议缓冲区Avro模式的优势数据流模式通过数据库的数据流通过服务实现数据流：REST 与 RPC持久化执行与工作流事件驱动架构摘要
6. 复制
单主节点复制同步与异步复制设置新追随者节点故障处理复制日志的实现复制延迟问题复制延迟的解决方案多主节点复制地理分布式操作同步引擎与本地优先软件处理冲突写入无领导者复制节点故障时的数据库写入机制单领导者与无领导者复制性能对比多区域操作检测并发写入总结
7. 分片
分片方案的优缺点分片技术在多租户中的应用键值数据分片按键值范围分片按键值哈希值分片负载偏斜与热点缓解操作：自动与手动再平衡请求路由分片与辅助索引本地次级索引全局次级索引总结
8. 事务处理
事务究竟是什么？ACID特性的内涵单对象与多对象操作弱隔离级别读已提交快照隔离与可重复读防止丢失更新写偏移与幻影可串行性实际串行执行两阶段锁定可串行化快照隔离分布式事务两阶段提交跨系统分布式事务数据库内部分布式事务精确一次消息处理再探总结
9. 分布式系统的困境
故障与部分故障不可靠网络TCP的局限性实际网络故障故障检测超时与无限延迟同步与异步网络不可靠时钟单调时钟与时间时钟时钟同步与精度依赖同步时钟进程暂停知识、真理与谎言多数决原则分布式锁与租约拜占庭故障系统模型与现实形式方法与随机化测试总结

10. 一致性与共识
线性化性何为线性化系统？依赖线性化特性实现线性化系统线性化能力的代价ID生成器与逻辑时钟逻辑时钟线性化ID生成器共识共识的多重面貌实践中的共识协调服务摘要
11. 批处理
使用Unix工具进行批处理简单日志分析命令链与自定义程序排序与内存聚合分布式系统中的批处理分布式文件系统对象存储分布式作业编排批处理模型MapReduce数据流引擎数据洗牌连接与分组查询语言数据帧批处理用例提取-转换-加载分析机器学习衍生数据服务摘要
12. 流处理
事件流传输消息系统基于日志的消息代理数据库与流保持系统同步变更数据捕获状态、流与不可变性流处理流处理的应用场景时间推理流连接容错性摘要
13. 流式系统的哲学
数据集成通过数据推导组合专用工具批处理与流处理解耦数据库组合数据存储技术围绕数据流设计应用程序观察推导状态追求正确性数据库的端到端论证强制约束及时性与完整性信任但需验证摘要
14. 做正确的事
预测分析偏见与歧视责任与问责反馈循环隐私与追踪监控同意与选择自由隐私与数据使用数据作为资产与权力重温工业革命立法与自我监管摘要
术语表
索引
关于作者

Content preview from 设计数据密集型应用程序 (Chinese Edition), 2nd Edition

第七章. 分片

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

显然，我们必须摆脱顺序思维的束缚，避免限制计算机能力。我们需要定义数据优先级与描述，阐明关系而非程序。

格蕾丝·默里·霍珀，《管理与未来计算机》（1962年）

分布式数据库通常通过两种方式将数据分布到节点上：

它会在多个节点上存储相同数据的副本。这便是复制机制，我们在第六章中已进行过讨论。
当数据量过大或写入吞吐量过高导致单节点无法处理时，系统会将数据拆分为更小的分片或分区，并将不同分片存储在不同节点上。本章将详细探讨分片机制。

通常，分片被定义为每条数据（每条记录、行或文档）仅属于一个分片。实现此目标的方法多种多样，本章将深入探讨。实际上，每个分片本身就是一个小型数据库，尽管某些数据库系统支持同时涉及多个分片的操作。

分片通常与复制结合使用，使每个分片的副本存储在多个节点上。这意味着尽管每条记录仅属于一个分片，但为实现容错性，它仍可能存储在多个不同节点上。

单个节点可存储多个分片。若采用单领袖复制模型，分片与复制的组合可如图7-1所示：每个分片的领袖节点分配给某一节点，其追随者节点则分配给其他节点。每个节点可能同时担任某些分片的领袖和另一些分片的追随者，但每个分片仍仅有一个领袖。

Diagram illustrating the combination of replication and sharding, showing nodes acting as leaders for some shards and followers for others, with arrows indicating replication streams.

分片与分区

本章所称的分片在不同软件中拥有多种名称：Kafka中称为分区（partition），CockroachDB中称为范围（range），HBase和TiDB中称为区域（region），Couchbase中称为vBucket，Riak中称为vnode，Cassandra中称为令牌范围（token-range），Bigtable、YugabyteDB和ScyllaDB中称为片（tablet），此处仅举几例。

部分数据库将分区与分片视为两个独立概念。例如在PostgreSQL中，分区是将大型表拆分为多个文件并存储于同一机器的技术（具有诸多优势，如可快速删除整个分区），而分片则是将数据集拆分至多台机器 [1, 2]。在许多其他系统中，分区与分片实为同义词。

虽然分区一词描述性很强，但分片这个术语可能令人意外。据一种理论，该术语源自网络角色扮演游戏《Ultima Online》——游戏中魔法水晶碎裂成片，每片碎片都折射出游戏世界的副本[3]。因此"shard"最初指代并行游戏服务器集群中的单个节点，后被引入数据库领域。另一种说法认为该词源于"高可用性复制数据系统"（System for Highly Available Replicated Data）的缩写——据称是1980年代的数据库系统，其具体细节已湮没于历史长河。

顺带一提，分区（）与网络分区（netsplits）无关，后者指节点间网络故障类型。此类故障将在第9章讨论。

第6章关于数据库复制的所有内容同样适用于分片复制。由于分片方案的选择基本独立于复制方案的选择，为简化说明，本章将忽略复制机制。

分片的优缺点

数据库分片的根本动因在于可扩展性。当数据量或写吞吐量超出单节点承载能力时，分片便成为解决方案——它能将数据与写操作分散至多个节点。（若问题在于读吞吐量，则未必需要分片，可采用 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 0642572336233

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

设计数据密集型应用程序 (Chinese Edition), 2nd Edition

by Martin Kleppmann, Chris Riccomini

第七章. 分片

图7-1. 复制与分片结合：每个节点既是某些分片的领导者，也是其他分片的追随者

分片的优缺点

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.