book

可扩展系统基础

Name: 可扩展系统基础
Author: Ian Gorton
ISBN: 9798341657328

by Ian Gorton

May 2025

Beginner to intermediate

340 pages

3h 54m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
为什么需要可扩展性？本书适合人群您将学到什么教育工作者须知本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
I.基础知识
1.可扩展系统简介
什么是可扩展性？本世纪初的系统规模实例我们是如何到达这里的？系统增长简史可扩展性基本设计原则可扩展性和成本可扩展性与架构权衡性能可用性安全可管理性摘要和进一步阅读
2.分布式系统架构：简介
基本系统架构缩小规模使用缓存扩展数据库分发数据库多处理层提高响应能力系统和硬件可扩展性摘要和进一步阅读
3.分布式系统基础
通信基础知识通信硬件通信软件远程方法调用部分故障分布式系统中的共识分布式系统中的时间摘要和进一步阅读
4.并行系统概述
为什么要并发？线程线程执行顺序线程的问题比赛条件僵局主题国螺纹协调线池障碍同步螺纹安全系列摘要和进一步阅读
II.可扩展系统
5.应用服务
服务设计应用编程接口 (API)设计服务国家管理应用服务器水平缩放负载平衡负载分配政策健康监测弹性会议亲和力摘要和进一步阅读
6.分布式缓存
应用缓存网络缓存缓存控制过期和最后修改Etag摘要和进一步阅读
7.异步信息传递
信息传送简介信息传递原语信息持久性发布-订阅信息复制示例：RabbitMQ消息、交换和队列分布与并发数据安全与性能权衡可用性和性能权衡信息传递模式相互竞争的消费者一次处理中毒信息摘要和进一步阅读

8.无服务器处理系统
无服务器的魅力谷歌应用引擎基础知识GAE 标准环境自动缩放AWS LambdaLambda 函数生命周期执行方面的考虑因素可扩展性案例研究：平衡吞吐量与成本选择参数值GAE 自动缩放参数研究设计成果摘要和进一步阅读
9.微服务
微服务运动单片式应用打破巨石部署微服务微服务原则微服务中的弹性级联故障隔板样式摘要和进一步阅读
III.可扩展分布式数据库
10.可扩展数据库基础
分布式数据库扩展关系数据库扩大规模扩展：读取副本缩小规模：数据分区示例：Oracle RAC向 NoSQL 转移NoSQL 数据模型查询语言数据分布CAP 定理摘要和进一步阅读
11.最终一致性
什么是最终一致性？不一致窗口阅读自己的作品可调一致性法定人数读写复制品维修主动维修被动修复处理冲突最后一位作家获胜版本向量摘要和进一步阅读
12.强烈的一致性
强一致性简介一致性模型分布式交易两阶段承诺2PC 故障模式分布式共识算法筏子领导人选举在实践中保持高度一致伏特数据库Google Cloud Spanner摘要和进一步阅读
13.分布式数据库实施
Redis数据模型和应用程序接口分发和复制优势和劣势MongoDB数据模型和应用程序接口分发和复制优势和劣势亚马逊 DynamoDB数据模型和应用程序接口分发和复制优势和劣势摘要和进一步阅读
IV.事件和流处理
14.可扩展的事件驱动处理
事件驱动架构Apache Kafka主题生产者和消费者可扩展性可用性摘要和进一步阅读
15.流处理系统
流处理简介流处理平台案例研究：Apache Flink数据流 API可扩展性数据安全结论和进一步阅读
16.成功的最后提示
自动化可观察性部署平台数据湖进一步阅读和结论
索引
关于作者

Content preview from 可扩展系统基础

第 6 章分布式缓存分布式缓存

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

缓存存在于应用程序的许多地方。运行应用程序的 CPU 具有快速的多级硬件缓存，可减少相对较慢的主内存访问。数据库引擎可以利用主内存来缓存数据存储的内容，这样在很多情况下，查询就不必接触相对较慢的磁盘。

分布式缓存是可扩展系统的重要组成部分。缓存可使昂贵的查询和计算结果以较低的成本供后续请求重复使用。由于无需为每次请求重建缓存结果，系统的容量得以提高，并可扩展以处理更大的工作负载。

本章将介绍两种缓存方式。应用缓存要求业务逻辑包含缓存和使用分布式缓存访问预计算结果。网络缓存利用 HTTP 协议内置的机制，在互联网提供的基础架构内实现结果缓存。如果使用得当，这两种方法都能保护您的服务和数据库免受大读取流量负载的影响。

应用缓存

应用缓存的目的是通过将查询和计算结果存储在内存中，以便以后的请求可以使用，从而提高请求的响应速度。例如，读者可以在在线报纸网站上发表评论。文章一旦发布，即使有变化，也不会经常变化。新的评论往往在文章发表后不久就会发布，但随着文章年龄的增长，频率会迅速下降。因此，一篇文章可以在首次访问时被缓存，并被所有后续请求重复使用，直到文章更新、新评论发布或没有人再想阅读它为止。

一般来说，缓存可以减轻数据库的大量读取流量，因为许多查询可以直接从缓存中进行。同时，缓存还能降低构建成本高昂的对象的计算成本，例如，需要跨多个不同数据库查询的对象。这样做的净效果是减少了服务和数据库的计算负荷，并为更多请求创造了裕度或容量。

缓存需要额外的资源和成本来存储缓存结果。不过，与升级数据库和服务节点以应对更高的请求负载相比，精心设计的缓存方案成本较低。作为缓存价值的体现，Twitter大约有3% 的基础设施专门用于应用级缓存。在 Twitter 的规模上，运行着数百个集群，这是一个庞大的基础设施！

应用级缓存利用专用分布式缓存引擎。该领域的两种主流技术是memcached和Redis。这两种技术本质上都是分布式内存哈希表，用于存储代表数据库查询结果或下游服务 API 调用结果的任意数据（字符串、对象）。缓存的常见用例包括存储用户会话数据、动态网页和数据库查询结果。缓存在应用服务中显示为单个存储，对象通过对象键的散列函数分配给各个缓存服务器。

基本方案如图 6-1 所示。服务首先会检查缓存，看所需数据是否可用。如果是，它将返回缓存内容作为结果，这就是所谓的缓存命中。如果缓存中没有数据--即缓存未命中，服务就会从数据库中检索所请求的数据，并将查询结果写入缓存，这样就可以在不查询数据库的情况下满足客户的后续请求。

例如，在繁忙的冬季度假胜地，滑雪者和滑雪板爱好者可以使用移动应用程序估算整个度假胜地的缆车等候时间。这样，他们就可以制定计划，避开需要等待 15 分钟或更长时间才能乘坐缆车的拥挤区域！

每次有滑雪者搭乘缆车时，都会有一条信息发送到公司的服务系统，该系统会收集滑雪者流量模式的数据。利用这些数据，系统可以根据乘坐缆车的滑雪者人数和到达速度估算出缆车等待时间。这种计算耗资巨大，繁忙时可能需要一秒或更长时间，因为它需要汇总可能数以万计的缆车乘坐记录并进行等待时间计算。因此，一旦计算出结果，其有效期为五分钟。只有过了这段时间，才会进行新的计算并得出结果。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341657328

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

可扩展系统基础

by Ian Gorton

第 6 章分布式缓存分布式缓存

应用缓存

图 6-1. 应用级缓存

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.