book

用于 DevOps 的 Python

Name: 用于 DevOps 的 Python
ISBN: 9798341657380

by Noah Gift, Kennedy Behrman, Alfredo Deza, Grig Gheorghiu

May 2025

Intermediate to advanced

506 pages

6h 56m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
DevOps 对作者意味着什么？如何使用本书概念专题本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢诺亚肯尼迪阿尔弗雷多Grig
1.DevOps 的 Python 基础知识
安装和运行 PythonPython ShellJupyter 笔记本程序设计变量基础数学评论内置功能打印范围执行控制if/elif/else循环while 循环处理异常内置对象什么是对象？对象方法和属性序列功能功能剖析作为对象的函数匿名功能使用正则表达式搜索字符集角色类别组别命名小组查找全部查找迭代器替换编译懒惰评估发电机生成器综合更多 IPython 功能使用 IPython 运行 Unix Shell 命令练习
2.文件和文件系统自动化
读写文件使用正则表达式搜索文本处理大型文件加密文本使用 Hashlib 进行散列用密码学加密操作系统模块使用 os.path 管理文件和目录使用 os.walk 查找目录树使用 Pathlib 将路径作为对象
3.使用命令行
使用外壳使用 sys 模块与译员对话使用 os 模块处理操作系统使用子进程模块生成进程创建命令行工具使用 sys.argv使用 argparse使用点击抨击实施插件案例研究：使用命令行工具为 Python 增效使用 Numba 即时 (JIT) 编译器通过 CUDA Python 使用 GPU使用 Numba 运行真正的多核多线程 PythonKMeans 聚类练习
4.实用的 Linux 实用工具
磁盘实用程序衡量绩效分区检索特定设备信息Network+ 实用工具SSH 隧道技术使用 Apache Benchmark 对 HTTP 进行基准测试 (ab)使用 molotov 进行负载测试CPU 实用程序使用 htop 查看进程使用 bash 和 ZSH自定义 Python Shell递归环球搜索并用确认提示替换删除 Python 临时文件列表和筛选过程Unix 时间戳将 Python 与 bash 和 ZSH 混合使用随机密码生成器我的模块存在吗？将目录更改为模块路径将 CSV 文件转换为 JSON 文件Python 单口相声调试器这个片段的速度有多快？测量练习案例研究问题
5.包装管理
包装为何重要？何时不需要包装包装指南描述性版本管理更新日志选择战略包装解决方案本地 Python 打包Debian 打包RPM 包装使用 systemd 进行管理长期运行进程设置systemd 单元文件安装设备日志处理练习案例研究问题
6.持续集成和持续部署
真实世界案例研究：将维护不善的 WordPress 网站转换为雨果网站设置雨果将 WordPress 转为 Hugo Posts创建并更新 Algolia 索引使用 Makefile 进行协调使用 AWS CodePipeline 进行部署真实世界案例研究：使用 Google Cloud Build 部署 Python 应用引擎应用程序真实世界案例研究：NFSOPS
7.监测和记录
构建可靠系统的关键概念不可改变的 DevOps 原则集中登录案例研究：生产型数据库杀死硬盘是自建还是购买？容错监测石墨统计司普罗米修斯仪器命名约定记录为什么很难？基本配置深化配置常见模式ELK 堆栈LogstashElasticsearch 和 Kibana练习案例研究问题
8.Pytest for DevOps
用 pytest 测试超能力pytest 入门使用 pytest 进行测试与 unittest 的区别pytest 功能conftest.py惊人的断言参数化装置入门内置装置基础设施测试什么是系统验证？Testinfra 简介连接远程节点特色和特殊装置实例使用 pytest 测试 Jupyter 笔记本练习案例研究问题
9.云计算
云计算基础云计算的类型云服务的类型基础设施即服务金属即服务平台即服务无服务器计算软件即服务基础设施即代码持续交付虚拟化和容器硬件虚拟化软件定义网络软件定义存储集装箱分布式计算的挑战与机遇云时代的 Python 并发、性能和流程管理流程管理用子流程管理流程使用多重处理解决问题使用 Pool() 分叉进程功能即服务和无服务器使用 Numba 实现高性能 Python使用 Numba 及时编译器使用高性能服务器结论练习案例研究问题

10.基础设施即代码
基础设施自动化工具分类手动调配使用 Terraform 自动配置基础设施配置 S3 存储桶使用 AWS ACM 配置 SSL 证书调配亚马逊 CloudFront 分发配置路由 53 DNS 记录将静态文件复制到 S3删除用 Terraform 提供的所有 AWS 资源利用 Pulumi 自动调配基础设施为 AWS 创建新的 Pulumi Python 项目为暂存堆栈创建配置值配置 ACM SSL 证书配置路由 53 区域和 DNS 记录调配 CloudFront 分发为网站 URL 提供路由 53 DNS 记录创建和部署新堆栈练习
11.容器技术：Docker 和 Docker Compose
什么是 Docker 容器？创建、构建、运行和删除 Docker 映像和容器将 Docker 映像发布到 Docker 注册中心在不同主机上运行具有相同映像的 Docker 容器使用 Docker Compose 运行多个 Docker 容器将 Docker-compose 服务移植到新的主机和操作系统上练习
12.容器协调：Kubernetes
Kubernetes 概念简述使用 Kompose 从 Docker-compose.yaml 创建 Kubernetes 清单基于 minikube 将 Kubernetes Manifest 部署到本地 Kubernetes 集群使用 Pulumi 在 GCP 中启动 GKE Kubernetes 集群将 Flask 示例应用程序部署到 GKE安装 Prometheus 和 Grafana 舵图销毁 GKE 群集练习
13.无服务器技术
向 "三大 "云提供商部署相同的 Python 函数安装无服务器框架向 AWS Lambda 部署 Python 函数将 Python 函数部署到 Google Cloud Functions 中向 Azure 部署 Python 函数在自托管 FaaS 平台上部署 Python 函数向 OpenFaaS 部署 Python 函数使用 AWS CDK 提供 DynamoDB 表、Lambda 函数和 API 网关方法练习
14.MLOps 和机器学习工程
什么是机器学习？监督机器学习建模Python 机器学习生态系统使用 PyTorch 进行深度学习Cloud 机器学习平台机器学习成熟度模型机器学习关键术语第 1 层次：制定框架、确定范围和定义问题第 2 级：持续交付数据第 3 级：持续交付清洁数据第 4 级：持续提供探索性数据分析第 5 级：传统 ML 和 AutoML 的持续交付第 6 层：ML 运行反馈回路使用 Kubernetes 和 Docker 学习 Flask使用 Kubernetes 和 Docker 学习 FlaskEDA建模调整缩放 GBM适合模型评估adhoc_predictJSON 工作流程刻度输入来自 Pickle 的 adhoc_predict刻度输入练习案例研究问题学习评估
15.数据工程
小数据处理小数据文件写入文件读取文件读取和处理线路的发生器管道使用 YAML大数据大数据工具、组件和平台数据来源文件系统数据存储实时流输入案例研究：建立本土数据管道无服务器数据工程将 AWS Lambda 与 CloudWatch 事件结合使用使用 AWS Lambda 进行亚马逊 CloudWatch 日志记录使用 AWS Lambda 填充亚马逊简单队列服务连接 CloudWatch 事件触发器创建事件驱动的 Lambda从 AWS Lambda 读取亚马逊 SQS 事件结论练习案例研究问题
16.DevOps 战争故事与访谈
电影制片厂无法制作电影游戏工作室无法交付游戏Python 脚本启动需要 60 秒用缓存和智能仪器灭火你将自动失业！DevOps 反模式无自动构建服务器反模式盲人飞行难以将协调作为一项持续的成就没有团队精神访谈格伦-所罗门安德鲁-阮加布里埃拉-罗曼里戈贝托-罗切乔纳森-拉库尔维尔-图洛斯约瑟夫-雷斯Teijo Holzer马特-哈里森迈克尔-福德建议练习挑战顶点项目
索引

Content preview from 用于 DevOps 的 Python

第 7 章监控和日志监控和日志记录

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

诺亚在旧金山的创业公司工作时，利用午休时间锻炼身体。他会打篮球，跑到科伊特塔，或者练习巴西柔术。诺亚工作过的大多数初创公司都会提供丰盛的午餐。

吃完午饭回来，他发现了一个非常不寻常的规律。从来没有什么不健康的东西可以吃。吃剩的往往是沙拉、水果、蔬菜或健康的瘦肉。在他锻炼身体的时候，成群结队的初创公司员工吃光了所有不健康的食物，让他没有吃坏东西的诱惑。不随大流是有道理的。

同样，在开发机器学习模型、移动应用程序和网络应用时，忽略运算也是一条捷径。忽视运维是非常典型的做法，就像在餐饮午餐中吃薯片、苏打水和冰淇淋一样。不过，正常并不一定是首选。本章将介绍 "沙拉和瘦肉 "的软件开发方法。

构建可靠系统的关键概念

在创建公司的过程中，我发现在软件工程方面，哪些做法是行之有效的，哪些做法是行不通的。最好的反模式之一就是 "相信我"。任何理智的 DevOps 专业人士都不会相信人类。人是有缺陷的，会犯感情用事的错误，还可能一时兴起毁掉整个公司。尤其是如果他们是公司的创始人。

要建立可靠的系统，更好的办法是逐块建立，而不是基于完全无稽之谈的层次结构。此外，在创建平台时，应定期预测失败。唯一会影响这一真理的是，如果有一个有权势的人参与构建架构。在这种情况下，这一真理就会成倍增加。

你可能听说过 Netflix 的混乱猴子，但何必呢？倒不如让公司创始人、首席技术官或工程副总裁来进行逐一编码，并对架构和代码库进行二次评估。人类的混乱猴子会比 Netflix 跑得更快。更妙的是，让他们在生产中断时编译 jar 文件，并通过 SSH 将其逐个放到节点上，同时大喊："这样就可以了！"这样，就能达到混乱与自我的和谐统一。

一个理智的 DevOps 专业人员的行动项目是什么？自动化大于等级制度。解决初创企业混乱局面的唯一办法就是自动化、怀疑主义、谦逊和永恒不变的 DevOps 原则。

不可改变的 DevOps 原则

很难想象，要建立一个可靠的系统，还有比这一永恒不变的原则更好的起点。如果首席技术官正在用笔记本电脑构建 Java.jar 文件来修复生产中的火灾，那你还是辞职算了。没有什么能拯救你的公司。我们应该知道，我们曾经经历过！

无论一个人多么聪明/强大/有魅力/有创造力/富有，如果他们在危机中手动对软件平台进行重要更改，你就已经死了。只是你还不知道而已。自动化是这种畸形存在的替代选择。

人类无法长期参与软件部署。这是软件行业存在的第一大弊端。它实质上是为流氓在你的平台上肆虐开了一扇后门。相反，部署软件、测试软件和构建软件需要 100% 的自动化。

建立持续集成和持续交付是对公司最重要的初始影响。相比之下，其他一切都显得微不足道。

集中登录

日志记录的重要性紧随自动化之后。在大规模分布式系统中，日志记录并非可有可无。必须特别注意应用程序和环境层面的日志记录。

例如，异常情况应始终发送到集中日志系统。另一方面，在开发软件时，创建调试日志而不是打印语句往往是个好主意。为什么要这样做呢？为了调试源代码，我们需要花费大量时间开发启发式方法。为什么不捕获这些信息，以便在生产中再次出现问题时开启呢？

这里的诀窍在于日志级别。通过创建只出现在非生产环境中的调试日志级别，可以将调试逻辑保留在源代码中。同样，在生产环境中不会出现过于冗长的日志，也不会造成混乱，而是可以对它们进行开关切换。

Ceph就是大规模分布式系统中日志记录的一个例子：守护进程最多可以有 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341657380

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business