第 12 章 DevOps 与 SRE:来自社区的声音
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
背景介绍
几乎从我与 SRE 社区互动的一开始,我就对 DevOps 和 SRE 之间的关系充满了好奇。我有幸与许多聪明人讨论过这个问题,也听到了许多聪明的想法。据我所知,这个问题还没有定论。与我交谈过的每个人都为我的理解增添了一些东西。当我要为这个话题寻找一个撰稿人时,我觉得最好的办法就是邀请尽可能多的人参与讨论。
欢迎来到一个实验--一个完全众包的篇章。
写作方法
2018 年 2 月底,我在网站上开设了一个页面,提出了以下问题:
在两段或更短的时间内,您认为 DevOps 和 SRE 之间的关系是什么?它们有何相似之处?它们有何不同?是否每个组织都能实施这两种方法?两者能否同时存在于同一个组织中?等等......
我通过 Twitter 和 LinkedIn 向我的专业社交网络发出了征集贡献的号召(并请他们也将这个网页的指针转发给他们的网络,很多人都很乐意这样做)。最后,Google Analytics 的报告显示,有来自 34 个国家的 1,165 人访问了投稿页面。
结果
看到大家对这些问题的深思熟虑的回答,我感到非常兴奋。现在,我向大家展示的是经过略微编辑的回复样本1没有特定的顺序,也没有特定的组织(因此,它准确地反映了互联网上讨论的 "混乱 "性质)。对于每条回复,我都列出了回复者的姓名、头衔和所属机构(如果他们选择分享这些信息的话)。
虽然这不是一个有代表性的调查,但我认为它很好地展示了关于这个问题的不同意见和相同意见。希望听到这样的讨论能让你们有机会开始形成自己对这个问题的看法。我还要说的是,我在介绍这些答复时有意不带自己的评论或观点。我不想试图把这个非牛顿流体的问题包装成一个整洁的蝴蝶结(这样只会让它逃脱蝴蝶结的束缚),也不想把我自己对材料的印象强加给你们的思考,我更想听到你们的结论。在这些问题上,你/我们是否更接近答案?
关于这个话题,我们显然还有很多话要说。如果你也想分享你的想法,请随时联系我,我很乐意倾听。
回复
网站可靠性是指运行的可靠性、可扩展性和效率。这包括业务连续性(灾难恢复、高可用性)。运营网站本身就是一个产品,可能包括他们自己的 CI/CD 内部工具。自动化倾向于定制工具;例如,使用 Boto 库的 Python、使用 AWS [Amazon Web Services] SDK 的 Ruby 和 Go 语言,而不是使用 Terraform 和 Ansible 等高级工具,因为它们被认为效率低下。虽然这不是绝对的,只是一种趋势。SRE 是对操作进行编程,以创建可靠、高效的基础设施。
DevOps 专注于打破文化孤岛,提高部署(CI/CD)管道的效率或速度,从开发到交付;这包括构建和工件前/后测试(工件构建前后的测试),因此称为 CT 或持续测试。它接替了 Agile 的工作,并接受了精益(Lean)的各个方面。DevOps 将在上游(构建、测试)进行优化和集成,在下游进行部署和交付。在部署/交付到运行站点方面,DevOps 与 SRE 存在重叠。也有对立的理想,DevOps 被整合到整个管道中,而 SRE 只负责运营基础设施,在严格的 DevOps 理念下会被视为一个孤岛。
-Joaquin Menchaca,NinjaPants Consulting 高级 DevOps ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access