book

Google系统架构解密：构建安全可靠的系统

Name: Google系统架构解密： 构建安全可靠的系统
ISBN: 9787115569257

by Heather Adkins, Betsy Beyer, Paul Blankinship, Piotr Lewandowski, Ana Oprea, Adam Stubblefield

September 2021

Beginner to intermediate

392 pages

12h 13m

Chinese

Posts & Telecom Press

Read now

Unlock full access

封面
扉页
版权
版权声明
O'Reilly Media, Inc.介绍
目录 (1/3)
目录 (2/3)
目录 (3/3)
推荐序一
推荐序二

对本书的赞誉
序一
序二
前言
写作初衷
读者对象
关于文化的提示如何阅读本书
排版约定
O’Reilly在线学习平台（O’Reilly Online Learning）
联系我们致谢
译者致谢
电子书
第一部分入门资料
第1章安全性与可靠性的交集
1.1 从密码和电钻谈起
1.2 可靠性与安全性：设计注意事项
1.3 机密性、完整性、可用性
1.3.1 机密性1.3.2 完整性
1.3.3 可用性
1.4 可靠性与安全性：共性1.4.1 隐形1.4.2 评估1.4.3 简洁性1.4.4 演变1.4.5 弹性1.4.6 从设计到生产1.4.7 调查系统和日志1.4.8 危机响应
1.4.9 恢复
1.5 小结
第2章了解攻击者
2.1 攻击者动机
2.2 攻击者画像 (1/2)
2.2.1 业余爱好者2.2.2 漏洞研究人员2.2.3 黑客活动家2.2.4 犯罪分子2.2.5 自动化和人工智能2.2.6 内部人员
2.2 攻击者画像 (2/2)
2.3 攻击者方法论
2.3.1 威胁情报2.3.2 网络杀伤链2.3.3 TTP
2.4 风险评估注意事项
2.5 小结
第二部分设计系统
第3章示例分析：安全代理
3.1 生产环境中的安全代理
3.2 Google工具代理
3.3 小结
第4章设计中的权衡
4.1 设计目标和要求
4.1.1 特性需求4.1.2 非功能性需求4.1.3 功能与涌现特性4.1.4 案例：Google的设计文档
4.2 需求平衡
4.3 处理紧张局势和统一目标
4.3.1 案例：微服务和Google Web应用程序框架
4.3.2 统一涌现特性的需求
4.4 初始速度和持续速度
4.5 小结
第5章最小特权设计
5.1 概念和术语
5.1.1 最小特权5.1.2 零信任网络5.1.3 零接触5.2 基于风险的访问分类
5.3 最佳实践 (1/2)
5.3.1 API功能最小化5.3.2 Breakglass机制5.3.3 审计
5.3 最佳实践 (2/2)
5.3.4 测试和最小特权5.3.5 诊断被拒绝的访问
5.3.6 优雅失败和Breakglass机制
5.4 工作案例：配置分发5.4.1 基于OpenSSH实现的POSIX API5.4.2 软件更新API5.4.3 自定义OpenSSH ForceCommand5.4.4 自定义HTTP接收器（边车）5.4.5 自定义HTTP接收器（内置）5.4.6 权衡取舍
5.5 一种用于认证和授权决策的策略框架
5.5.1 使用高级授权控件5.5.2 投入广泛使用的授权框架
5.5.3 避免潜在的陷阱
5.6 高级控制5.6.1 MPA5.6.2 3FA5.6.3 业务依据
5.6.4 临时访问
5.6.5 代理5.7 权衡和冲突5.7.1 增加了安全复杂性5.7.2 对合作商及公司文化的影响5.7.3 影响安全性的质量数据和系统5.7.4 对用户工作效率的影响5.7.5 对开发复杂性的影响
5.8 小结
第6章面向易理解性的设计
6.1 为什么易理解性很重要6.1.1 系统不变量6.1.2 分析不变量
6.1.3 心智模型
6.2 设计易理解的系统6.2.1 复杂性与易理解性6.2.2 分解复杂性
6.2.3 集中负责安全性和可靠性需求
6.3 系统架构 (1/3)6.3.1 易于理解的接口规范6.3.2 易于理解的身份、认证和访问控制
6.3 系统架构 (2/3)
6.3.3 安全边界
6.3 系统架构 (3/3)
6.4 软件设计
6.4.1 使用应用程序框架满足服务需求6.4.2 理解复杂的数据流6.4.3 考虑API的可用性
6.5 小结
第7章适应变化的设计
7.1 安全变更的类型
7.2 变更中的设计
7.3 让发布更容易的架构决策
7.3.1 让依赖项保持最新并频繁重建7.3.2 用自动化测试让发布更频繁7.3.3 使用容器7.3.4 使用微服务
7.4 不同的变更：不同的速度与不同的时间线 (1/2)
7.4.1 短期变更：零日漏洞7.4.2 中期变更：改善安全态势
7.4 不同的变更：不同的速度与不同的时间线 (2/2)
7.4.3 长期变更：外部需求
7.5 难点：计划调整
7.6 不断扩大的范围：心脏滴血漏洞
7.7 小结
第8章弹性设计
8.1 弹性设计原则
8.2 纵深防御8.2.1 特洛伊木马8.2.2 Google App Engine分析
8.3 控制降级 (1/2)
8.3.1 区分故障成本8.3.2 部署响应机制
8.3 控制降级 (2/2)
8.3.3 负责任的自动化
8.4 控制爆炸半径
8.4.1 角色分离8.4.2 位置分离
8.4.3 时间分离
8.5 故障域和冗余8.5.1 故障域8.5.2 组件类型8.5.3 控制冗余
8.6 持续验证
8.6.1 验证关键区域8.6.2 验证实践
8.7 实践建议：着手点
8.8 小结
第9章面向恢复性的设计
9.1 要恢复什么
9.1.1 随机错误9.1.2 意外错误9.1.3 软件错误
9.1.4 恶意行为
9.2 恢复机制的设计原则 (1/4)9.2.1 面向快速恢复的设计（受政策监督）9.2.2 限制对外部时间观念的依赖9.2.3 回滚所代表的安全性和可靠性间的权衡
9.2 恢复机制的设计原则 (2/4)
9.2 恢复机制的设计原则 (3/4)
9.2.4 使用显式吊销机制9.2.5 了解精确到字节的预期状态
9.2 恢复机制的设计原则 (4/4)
9.2.6 面向测试和持续验证的设计
9.3 紧急访问
9.3.1 访问控制9.3.2 通信9.3.3 响应人员的习惯
9.4 预期外的收益
9.5 小结
第10章缓解拒绝服务攻击
10.1 攻守双方的策略10.1.1 攻方的策略
10.1.2 守方的策略
10.2 面向防御的设计10.2.1 具有防御能力的架构
10.2.2 使服务具备防护能力
10.3 缓解攻击10.3.1 监控与告警10.3.2 优雅降级10.3.3 DoS防护系统10.3.4 有策略的响应
10.4 应对源于服务本身的“攻击”
10.4.1 用户行为10.4.2 客户端重试行为
10.5 小结
第三部分实现系统
第11章案例分析：设计、实现和维护一个受信任的公共CA
11.1 受信任的公共CA的背景
11.2 为什么需要受信任的公共CA
11.3 自建还是购买CA
11.4 设计、开发和维护过程中的考虑11.4.1 选择编程语言11.4.2 复杂与简明11.4.3 保护第三方和开源组件11.4.4 测试11.4.5 CA密钥材料的弹性11.4.6 数据验证
11.5 小结
第12章编写代码
12.1 框架级安全性和可靠性保证措施
12.1.1 使用框架的好处12.1.2 案例：用于创建RPC后端的框架
12.2 常见安全漏洞
12.2.1 SQL注入漏洞：TrustedSqlString12.2.2 预防XSS漏洞：SafeHtml
12.3 评估和构建框架的经验
12.3.1 用于常见任务的简单、安全、可靠的库12.3.2 部署策略
12.4 简洁性有助于提升代码的安全性和可靠性
12.4.1 避免多层嵌套12.4.2 消除YAGNI类代码12.4.3 偿还技术债务12.4.4 重构
12.5 默认安全性和可靠性
12.5.1 选择合适的工具12.5.2 使用强类型12.5.3 检查代码
12.6 小结
第13章代码测试
13.1 单元测试13.1.1 编写有效的单元测试13.1.2 编写单元测试的时机13.1.3 单元测试对代码的影响
13.2 集成测试
13.3 动态程序分析
13.4 模糊测试 (1/2)
13.4.1 模糊引擎的工作原理13.4.2 编写有效的模糊测试驱动程序13.4.3 示例fuzzer
13.4 模糊测试 (2/2)
13.4.4 持续模糊测试
13.5 静态程序分析 (1/2)
13.5.1 自动代码检查工具13.5.2 如何将静态分析集成至开发工作流中
13.5 静态程序分析 (2/2)
13.5.3 抽象解释
13.5.4 形式化方法
13.6 小结
第14章部署代码
14.1 概念和术语
14.2 威胁建模
14.3 最佳实践
14.3.1 强制做代码审查14.3.2 依赖自动化14.3.3 验证工件，而不仅仅是人14.3.4 将配置视为代码
14.4 基于威胁建模做安全加固
14.5 高级缓解策略 (1/2)
14.5.1 二进制文件来源14.5.2 基于来源的部署策略14.5.3 可验证的构建
14.5 高级缓解策略 (2/2)
14.5.4 部署阻塞点14.5.5 部署后验证
14.6 实用建议
14.6.1 一步步来14.6.2 提供可操作的错误消息14.6.3 确保来源信息明确14.6.4 创建明确的策略
14.6.5 引入Breakglass机制
14.7 重温基于威胁建模部署安全措施14.8 小结
第15章调查系统
15.1 从调试到调查 (1/3)
15.1.1 案例：临时文件15.1.2 调试技巧
15.1 从调试到调查 (2/3)
15.1.3 当陷入困境时该怎么办
15.1 从调试到调查 (3/3)
15.1.4 协同调试：一种教学方法15.1.5 安全调查与系统调试间的差异
15.2 收集恰当、有用的日志 (1/2)
15.2.1 将日志设计为不可变的15.2.2 考虑隐私要素15.2.3 确定要保留哪些安全相关的日志
15.2 收集恰当、有用的日志 (2/2)
15.2.4 日志记录成本
15.3 可靠、安全的调试访问
15.3.1 可靠性15.3.2 安全性
15.4 小结
第四部分维护系统
第16章防灾规划
16.1 “灾难”的定义
16.2 动态灾难响应策略
16.3 灾难风险分析
16.4 建立事件响应团队16.4.1 确定团队成员和角色16.4.2 制订团队章程16.4.3 建立严重性和优先级模型16.4.4 确定与IR团队合作的运营参数16.4.5 制订响应计划
16.4.6 创建详细的行动手册
16.4.7 确保访问和更新机制就位16.5 在事件发生前预先安排系统和人员16.5.1 配置系统16.5.2 培训
16.5.3 流程和程序
16.6 测试系统和响应计划16.6.1 审计自动化系统16.6.2 开展非侵入式桌面演练16.6.3 在生产环境中测试响应16.6.4 红队测试16.6.5 评估响应
16.7 Google的案例
16.7.1 具有全球影响的测试16.7.2 DiRT演习测试紧急访问16.7.3 行业级漏洞
16.8 小结
第17章危机管理
17.1 是否存在危机
17.1.1 事件分诊17.1.2 入侵与缺陷
17.2 指挥事件 (1/2)
17.2.1 第一步：不要惊慌17.2.2 开展响应17.2.3 组建自己的事件团队17.2.4 OpSec17.2.5 牺牲好的OpSec实践换取更大的利益17.2.6 调查过程
17.2 指挥事件 (2/2)
17.3 控制事件
17.3.1 并行处理事件17.3.2 移交17.3.3 士气
17.4 沟通
17.4.1 误解17.4.2 拐弯抹角17.4.3 会议17.4.4 让合适的人了解合适的细节
17.5 整合回顾
17.5.1 分诊17.5.2 宣布事件17.5.3 沟通和OpSec17.5.4 开始处理事件17.5.5 移交17.5.6 交还事件调查工作17.5.7 准备沟通和补救17.5.8 结束
17.6 小结
第18章恢复和善后
18.1 恢复调度
18.2 恢复时间线
18.3 恢复计划
18.3.1 确定恢复范围18.3.2 恢复过程的考虑因素18.3.3 恢复检查清单
18.4 启动恢复
18.4.1 隔离资产18.4.2 系统恢复和软件升级18.4.3 数据过滤18.4.4 恢复数据18.4.5 更换凭据和密钥
18.6 恢复之后
18.7 示例
18.7.1 被入侵的云实例18.7.2 大规模钓鱼攻击18.7.3 需要复杂恢复工作的、有针对性的攻击
18.8 小结
第五部分组织与文化
第19章案例研究：Chrome安全团队
19.1 背景和团队发展史
19.2 安全是团队的职责
19.3 帮助用户安全地浏览Web页面
19.4 速度很重要
19.5 设计纵深防御机制
19.6 保持透明，让社区参与进来
19.7 小结
第20章理解角色和责任
20.1 谁为安全性和可靠性负责
20.1.1 专家的作用20.1.2 了解安全专业知识
20.1.3 资格认证和学术教育
20.2 将安全性整合到组织中 (1/2)20.2.1 嵌入安全人员和安全团队20.2.2 案例：Google的嵌入式安全20.2.3 特殊的团队：蓝队和红队
20.2 将安全性整合到组织中 (2/2)
20.2.4 外部研究者
20.3 小结
第21章建立安全可靠的文化
21.1 定义健康的安全性和可靠性文化 (1/2)
21.1.1 默认的安全性和可靠性文化21.1.2 评审文化21.1.3 意识文化
21.1 定义健康的安全性和可靠性文化 (2/2)
21.1.4 说“是”的文化21.1.5 接受必然性的文化21.1.6 可持续发展文化
21.2 通过最佳实践改变文化
21.2.1 对齐项目目标和激励参与者21.2.2 通过风险规避机制减少恐惧21.2.3 使安全兜底措施成为常态21.2.4 提高生产力和可用性21.2.5 多沟通，保持透明21.2.6 怀抱同理心
21.3 说服领导层
21.3.1 了解决策过程21.3.2 为变革立案21.3.3 选择自己的战场21.3.4 升级和问题解决
21.4 小结
总结
附录A 灾难风险评估矩阵
作者介绍
封面介绍

Content preview from Google系统架构解密：构建安全可靠的系统

146

｜

第

章

试效率和生产现实性之间取得适当的平衡，要考虑测试可能的恢复方案。

还需要考虑各类利基测试场景，在这些情况下，恢复工作开展十分艰难。例如，在

Google

，

我们在一系列不同环境下实现了一种密码密钥管理协议：

ARM

和

x86 CPU

、

UEFI

和

bare-

metal

固件、

Microsoft

Visual C++ (MSVC)

、

Clang

、

GCC

编译器等。我们了解到，即便在端

到端测试上投入大量资金，模拟这一功能逻辑所有的故障模式也颇具挑战性。这是因为硬

件故障或中断的通信很难真实地模拟。相反，我们选择以一种可移植、与编译器和位宽度

无关的方式来实现核心逻辑。我们对逻辑进行了广泛的单元测试，特别留意了针对外部组

件的接口设计进行抽象。例如，为了伪造单个组件并模拟它们的故障行为，我们创建了分

别用于从

ﬂash

闪存读取并写入字节

、加密密钥存储空间以及性能监控原语的接口。由于能

明确地捕获想要恢复的故障类别，测试环境条件的方法经受住了时间的考验。

最后，通过持续验证寻找方法来建立对恢复方法的信心。恢复涉及人工操作，但人为因素

是不可靠且不可预测的。仅靠单元测试，甚至是持续集成

交付

部署

，都无法捕获人工

技能或习惯产生的错误。例如，除了验证恢复工作流的有效性和互操作性外，还必须验证

恢复指引的可读性和易理解性。

9.3

　紧急访问

本章中描述的恢复方法依赖响应者对系统的交互操作熟练度，也倡议在恢复过程中使用与

正常操作相同的主要服务。但为了能在正常访问方法完全中断时进行部署，还需要设计一

款特殊用途的解决方案。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9787115569257

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Google系统架构解密：构建安全可靠的系统

by Heather Adkins, Betsy Beyer, Paul Blankinship, Piotr Lewandowski, Ana Oprea, Adam Stubblefield

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

管理Kubernetes

机器学习实战：基于Scikit-Learn、Keras 和TensorFlow （原书第2 版）

Python机器学习基础教程

解密金融数据

Publisher Resources