book

Google系统架构解密：构建安全可靠的系统

Name: Google系统架构解密： 构建安全可靠的系统
ISBN: 9787115569257

by Heather Adkins, Betsy Beyer, Paul Blankinship, Piotr Lewandowski, Ana Oprea, Adam Stubblefield

September 2021

Beginner to intermediate

392 pages

12h 13m

Chinese

Posts & Telecom Press

Read now

Unlock full access

封面
扉页
版权
版权声明
O'Reilly Media, Inc.介绍
目录 (1/3)
目录 (2/3)
目录 (3/3)
推荐序一
推荐序二

对本书的赞誉
序一
序二
前言
写作初衷
读者对象
关于文化的提示如何阅读本书
排版约定
O’Reilly在线学习平台（O’Reilly Online Learning）
联系我们致谢
译者致谢
电子书
第一部分入门资料
第1章安全性与可靠性的交集
1.1 从密码和电钻谈起
1.2 可靠性与安全性：设计注意事项
1.3 机密性、完整性、可用性
1.3.1 机密性1.3.2 完整性
1.3.3 可用性
1.4 可靠性与安全性：共性1.4.1 隐形1.4.2 评估1.4.3 简洁性1.4.4 演变1.4.5 弹性1.4.6 从设计到生产1.4.7 调查系统和日志1.4.8 危机响应
1.4.9 恢复
1.5 小结
第2章了解攻击者
2.1 攻击者动机
2.2 攻击者画像 (1/2)
2.2.1 业余爱好者2.2.2 漏洞研究人员2.2.3 黑客活动家2.2.4 犯罪分子2.2.5 自动化和人工智能2.2.6 内部人员
2.2 攻击者画像 (2/2)
2.3 攻击者方法论
2.3.1 威胁情报2.3.2 网络杀伤链2.3.3 TTP
2.4 风险评估注意事项
2.5 小结
第二部分设计系统
第3章示例分析：安全代理
3.1 生产环境中的安全代理
3.2 Google工具代理
3.3 小结
第4章设计中的权衡
4.1 设计目标和要求
4.1.1 特性需求4.1.2 非功能性需求4.1.3 功能与涌现特性4.1.4 案例：Google的设计文档
4.2 需求平衡
4.3 处理紧张局势和统一目标
4.3.1 案例：微服务和Google Web应用程序框架
4.3.2 统一涌现特性的需求
4.4 初始速度和持续速度
4.5 小结
第5章最小特权设计
5.1 概念和术语
5.1.1 最小特权5.1.2 零信任网络5.1.3 零接触5.2 基于风险的访问分类
5.3 最佳实践 (1/2)
5.3.1 API功能最小化5.3.2 Breakglass机制5.3.3 审计
5.3 最佳实践 (2/2)
5.3.4 测试和最小特权5.3.5 诊断被拒绝的访问
5.3.6 优雅失败和Breakglass机制
5.4 工作案例：配置分发5.4.1 基于OpenSSH实现的POSIX API5.4.2 软件更新API5.4.3 自定义OpenSSH ForceCommand5.4.4 自定义HTTP接收器（边车）5.4.5 自定义HTTP接收器（内置）5.4.6 权衡取舍
5.5 一种用于认证和授权决策的策略框架
5.5.1 使用高级授权控件5.5.2 投入广泛使用的授权框架
5.5.3 避免潜在的陷阱
5.6 高级控制5.6.1 MPA5.6.2 3FA5.6.3 业务依据
5.6.4 临时访问
5.6.5 代理5.7 权衡和冲突5.7.1 增加了安全复杂性5.7.2 对合作商及公司文化的影响5.7.3 影响安全性的质量数据和系统5.7.4 对用户工作效率的影响5.7.5 对开发复杂性的影响
5.8 小结
第6章面向易理解性的设计
6.1 为什么易理解性很重要6.1.1 系统不变量6.1.2 分析不变量
6.1.3 心智模型
6.2 设计易理解的系统6.2.1 复杂性与易理解性6.2.2 分解复杂性
6.2.3 集中负责安全性和可靠性需求
6.3 系统架构 (1/3)6.3.1 易于理解的接口规范6.3.2 易于理解的身份、认证和访问控制
6.3 系统架构 (2/3)
6.3.3 安全边界
6.3 系统架构 (3/3)
6.4 软件设计
6.4.1 使用应用程序框架满足服务需求6.4.2 理解复杂的数据流6.4.3 考虑API的可用性
6.5 小结
第7章适应变化的设计
7.1 安全变更的类型
7.2 变更中的设计
7.3 让发布更容易的架构决策
7.3.1 让依赖项保持最新并频繁重建7.3.2 用自动化测试让发布更频繁7.3.3 使用容器7.3.4 使用微服务
7.4 不同的变更：不同的速度与不同的时间线 (1/2)
7.4.1 短期变更：零日漏洞7.4.2 中期变更：改善安全态势
7.4 不同的变更：不同的速度与不同的时间线 (2/2)
7.4.3 长期变更：外部需求
7.5 难点：计划调整
7.6 不断扩大的范围：心脏滴血漏洞
7.7 小结
第8章弹性设计
8.1 弹性设计原则
8.2 纵深防御8.2.1 特洛伊木马8.2.2 Google App Engine分析
8.3 控制降级 (1/2)
8.3.1 区分故障成本8.3.2 部署响应机制
8.3 控制降级 (2/2)
8.3.3 负责任的自动化
8.4 控制爆炸半径
8.4.1 角色分离8.4.2 位置分离
8.4.3 时间分离
8.5 故障域和冗余8.5.1 故障域8.5.2 组件类型8.5.3 控制冗余
8.6 持续验证
8.6.1 验证关键区域8.6.2 验证实践
8.7 实践建议：着手点
8.8 小结
第9章面向恢复性的设计
9.1 要恢复什么
9.1.1 随机错误9.1.2 意外错误9.1.3 软件错误
9.1.4 恶意行为
9.2 恢复机制的设计原则 (1/4)9.2.1 面向快速恢复的设计（受政策监督）9.2.2 限制对外部时间观念的依赖9.2.3 回滚所代表的安全性和可靠性间的权衡
9.2 恢复机制的设计原则 (2/4)
9.2 恢复机制的设计原则 (3/4)
9.2.4 使用显式吊销机制9.2.5 了解精确到字节的预期状态
9.2 恢复机制的设计原则 (4/4)
9.2.6 面向测试和持续验证的设计
9.3 紧急访问
9.3.1 访问控制9.3.2 通信9.3.3 响应人员的习惯
9.4 预期外的收益
9.5 小结
第10章缓解拒绝服务攻击
10.1 攻守双方的策略10.1.1 攻方的策略
10.1.2 守方的策略
10.2 面向防御的设计10.2.1 具有防御能力的架构
10.2.2 使服务具备防护能力
10.3 缓解攻击10.3.1 监控与告警10.3.2 优雅降级10.3.3 DoS防护系统10.3.4 有策略的响应
10.4 应对源于服务本身的“攻击”
10.4.1 用户行为10.4.2 客户端重试行为
10.5 小结
第三部分实现系统
第11章案例分析：设计、实现和维护一个受信任的公共CA
11.1 受信任的公共CA的背景
11.2 为什么需要受信任的公共CA
11.3 自建还是购买CA
11.4 设计、开发和维护过程中的考虑11.4.1 选择编程语言11.4.2 复杂与简明11.4.3 保护第三方和开源组件11.4.4 测试11.4.5 CA密钥材料的弹性11.4.6 数据验证
11.5 小结
第12章编写代码
12.1 框架级安全性和可靠性保证措施
12.1.1 使用框架的好处12.1.2 案例：用于创建RPC后端的框架
12.2 常见安全漏洞
12.2.1 SQL注入漏洞：TrustedSqlString12.2.2 预防XSS漏洞：SafeHtml
12.3 评估和构建框架的经验
12.3.1 用于常见任务的简单、安全、可靠的库12.3.2 部署策略
12.4 简洁性有助于提升代码的安全性和可靠性
12.4.1 避免多层嵌套12.4.2 消除YAGNI类代码12.4.3 偿还技术债务12.4.4 重构
12.5 默认安全性和可靠性
12.5.1 选择合适的工具12.5.2 使用强类型12.5.3 检查代码
12.6 小结
第13章代码测试
13.1 单元测试13.1.1 编写有效的单元测试13.1.2 编写单元测试的时机13.1.3 单元测试对代码的影响
13.2 集成测试
13.3 动态程序分析
13.4 模糊测试 (1/2)
13.4.1 模糊引擎的工作原理13.4.2 编写有效的模糊测试驱动程序13.4.3 示例fuzzer
13.4 模糊测试 (2/2)
13.4.4 持续模糊测试
13.5 静态程序分析 (1/2)
13.5.1 自动代码检查工具13.5.2 如何将静态分析集成至开发工作流中
13.5 静态程序分析 (2/2)
13.5.3 抽象解释
13.5.4 形式化方法
13.6 小结
第14章部署代码
14.1 概念和术语
14.2 威胁建模
14.3 最佳实践
14.3.1 强制做代码审查14.3.2 依赖自动化14.3.3 验证工件，而不仅仅是人14.3.4 将配置视为代码
14.4 基于威胁建模做安全加固
14.5 高级缓解策略 (1/2)
14.5.1 二进制文件来源14.5.2 基于来源的部署策略14.5.3 可验证的构建
14.5 高级缓解策略 (2/2)
14.5.4 部署阻塞点14.5.5 部署后验证
14.6 实用建议
14.6.1 一步步来14.6.2 提供可操作的错误消息14.6.3 确保来源信息明确14.6.4 创建明确的策略
14.6.5 引入Breakglass机制
14.7 重温基于威胁建模部署安全措施14.8 小结
第15章调查系统
15.1 从调试到调查 (1/3)
15.1.1 案例：临时文件15.1.2 调试技巧
15.1 从调试到调查 (2/3)
15.1.3 当陷入困境时该怎么办
15.1 从调试到调查 (3/3)
15.1.4 协同调试：一种教学方法15.1.5 安全调查与系统调试间的差异
15.2 收集恰当、有用的日志 (1/2)
15.2.1 将日志设计为不可变的15.2.2 考虑隐私要素15.2.3 确定要保留哪些安全相关的日志
15.2 收集恰当、有用的日志 (2/2)
15.2.4 日志记录成本
15.3 可靠、安全的调试访问
15.3.1 可靠性15.3.2 安全性
15.4 小结
第四部分维护系统
第16章防灾规划
16.1 “灾难”的定义
16.2 动态灾难响应策略
16.3 灾难风险分析
16.4 建立事件响应团队16.4.1 确定团队成员和角色16.4.2 制订团队章程16.4.3 建立严重性和优先级模型16.4.4 确定与IR团队合作的运营参数16.4.5 制订响应计划
16.4.6 创建详细的行动手册
16.4.7 确保访问和更新机制就位16.5 在事件发生前预先安排系统和人员16.5.1 配置系统16.5.2 培训
16.5.3 流程和程序
16.6 测试系统和响应计划16.6.1 审计自动化系统16.6.2 开展非侵入式桌面演练16.6.3 在生产环境中测试响应16.6.4 红队测试16.6.5 评估响应
16.7 Google的案例
16.7.1 具有全球影响的测试16.7.2 DiRT演习测试紧急访问16.7.3 行业级漏洞
16.8 小结
第17章危机管理
17.1 是否存在危机
17.1.1 事件分诊17.1.2 入侵与缺陷
17.2 指挥事件 (1/2)
17.2.1 第一步：不要惊慌17.2.2 开展响应17.2.3 组建自己的事件团队17.2.4 OpSec17.2.5 牺牲好的OpSec实践换取更大的利益17.2.6 调查过程
17.2 指挥事件 (2/2)
17.3 控制事件
17.3.1 并行处理事件17.3.2 移交17.3.3 士气
17.4 沟通
17.4.1 误解17.4.2 拐弯抹角17.4.3 会议17.4.4 让合适的人了解合适的细节
17.5 整合回顾
17.5.1 分诊17.5.2 宣布事件17.5.3 沟通和OpSec17.5.4 开始处理事件17.5.5 移交17.5.6 交还事件调查工作17.5.7 准备沟通和补救17.5.8 结束
17.6 小结
第18章恢复和善后
18.1 恢复调度
18.2 恢复时间线
18.3 恢复计划
18.3.1 确定恢复范围18.3.2 恢复过程的考虑因素18.3.3 恢复检查清单
18.4 启动恢复
18.4.1 隔离资产18.4.2 系统恢复和软件升级18.4.3 数据过滤18.4.4 恢复数据18.4.5 更换凭据和密钥
18.6 恢复之后
18.7 示例
18.7.1 被入侵的云实例18.7.2 大规模钓鱼攻击18.7.3 需要复杂恢复工作的、有针对性的攻击
18.8 小结
第五部分组织与文化
第19章案例研究：Chrome安全团队
19.1 背景和团队发展史
19.2 安全是团队的职责
19.3 帮助用户安全地浏览Web页面
19.4 速度很重要
19.5 设计纵深防御机制
19.6 保持透明，让社区参与进来
19.7 小结
第20章理解角色和责任
20.1 谁为安全性和可靠性负责
20.1.1 专家的作用20.1.2 了解安全专业知识
20.1.3 资格认证和学术教育
20.2 将安全性整合到组织中 (1/2)20.2.1 嵌入安全人员和安全团队20.2.2 案例：Google的嵌入式安全20.2.3 特殊的团队：蓝队和红队
20.2 将安全性整合到组织中 (2/2)
20.2.4 外部研究者
20.3 小结
第21章建立安全可靠的文化
21.1 定义健康的安全性和可靠性文化 (1/2)
21.1.1 默认的安全性和可靠性文化21.1.2 评审文化21.1.3 意识文化
21.1 定义健康的安全性和可靠性文化 (2/2)
21.1.4 说“是”的文化21.1.5 接受必然性的文化21.1.6 可持续发展文化
21.2 通过最佳实践改变文化
21.2.1 对齐项目目标和激励参与者21.2.2 通过风险规避机制减少恐惧21.2.3 使安全兜底措施成为常态21.2.4 提高生产力和可用性21.2.5 多沟通，保持透明21.2.6 怀抱同理心
21.3 说服领导层
21.3.1 了解决策过程21.3.2 为变革立案21.3.3 选择自己的战场21.3.4 升级和问题解决
21.4 小结
总结
附录A 灾难风险评估矩阵
作者介绍
封面介绍

Content preview from Google系统架构解密：构建安全可靠的系统

弹性设计

｜

109

限流

限流（参见《

SRE

：

Google

运维解密》中的第

章）通过延迟当前操作来间接修改客户

端的行为，以便推迟将来的操作。服务器收到请求后，可能会在处理请求之前等待，或

者一旦处理完请求，就在将响应发送到客户端之前等待。此方法降低了服务器从客户端

接收请求的速率（如果客户端按顺序发送请求），这意味着你可以重定向在等待期间节省

的资源。

与降低负载相似，你可以定制策略，将限流措施应用于特定的违规客户端，或者更普遍地

应用于所有的客户端。请求优先级和成本在选择限制哪些请求时起了作用。

自动响应

服务器利用率的统计有助于确定何时应用降低负载和限流等控制措施。服务器的负载越

重，它可以处理的流量或负载就越少。如果激活控制机制的时间过长，则可能丢弃或限制

优先级较高的请求。

要有效地大规模管理这些降级控制，需要一个内部中央服务。你可以将有关功能和故障成

本的业务考虑因素转化为此服务的策略和信号。该内部服务还可以聚合客户端和服务的启

发式信息，以便近乎实时地将更新的策略分发到所有服务器。然后服务器可以根据服务器

利用率的规则应用这些策略。

自动响应的一些可能做法包括以下几种：

•

实施可响应式的限流信号，并尝试将流量转移到负载较低的服务器的负载均衡系统；

•

提供

DoS

保护，可在限流无效或流量具有破坏性时，帮忙向恶意客户端发出响应；

•

使用关键服务的重负载报告，触发将故障转移到备用组件的准备（本章后面的部分将讨

论这一策略）。

你还可以将自动化用于自发的故障检测：如果服务器确定它不能服务于某些类别甚至所有 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9787115569257

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Google系统架构解密：构建安全可靠的系统

by Heather Adkins, Betsy Beyer, Paul Blankinship, Piotr Lewandowski, Ana Oprea, Adam Stubblefield

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

管理Kubernetes

机器学习实战：基于Scikit-Learn、Keras 和TensorFlow （原书第2 版）

Python机器学习基础教程

解密金融数据

Publisher Resources