book

用于 DevOps 的 Python

Name: 用于 DevOps 的 Python
ISBN: 9798341657380

by Noah Gift, Kennedy Behrman, Alfredo Deza, Grig Gheorghiu

May 2025

Intermediate to advanced

506 pages

6h 56m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
DevOps 对作者意味着什么？如何使用本书概念专题本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢诺亚肯尼迪阿尔弗雷多Grig
1.DevOps 的 Python 基础知识
安装和运行 PythonPython ShellJupyter 笔记本程序设计变量基础数学评论内置功能打印范围执行控制if/elif/else循环while 循环处理异常内置对象什么是对象？对象方法和属性序列功能功能剖析作为对象的函数匿名功能使用正则表达式搜索字符集角色类别组别命名小组查找全部查找迭代器替换编译懒惰评估发电机生成器综合更多 IPython 功能使用 IPython 运行 Unix Shell 命令练习
2.文件和文件系统自动化
读写文件使用正则表达式搜索文本处理大型文件加密文本使用 Hashlib 进行散列用密码学加密操作系统模块使用 os.path 管理文件和目录使用 os.walk 查找目录树使用 Pathlib 将路径作为对象
3.使用命令行
使用外壳使用 sys 模块与译员对话使用 os 模块处理操作系统使用子进程模块生成进程创建命令行工具使用 sys.argv使用 argparse使用点击抨击实施插件案例研究：使用命令行工具为 Python 增效使用 Numba 即时 (JIT) 编译器通过 CUDA Python 使用 GPU使用 Numba 运行真正的多核多线程 PythonKMeans 聚类练习
4.实用的 Linux 实用工具
磁盘实用程序衡量绩效分区检索特定设备信息Network+ 实用工具SSH 隧道技术使用 Apache Benchmark 对 HTTP 进行基准测试 (ab)使用 molotov 进行负载测试CPU 实用程序使用 htop 查看进程使用 bash 和 ZSH自定义 Python Shell递归环球搜索并用确认提示替换删除 Python 临时文件列表和筛选过程Unix 时间戳将 Python 与 bash 和 ZSH 混合使用随机密码生成器我的模块存在吗？将目录更改为模块路径将 CSV 文件转换为 JSON 文件Python 单口相声调试器这个片段的速度有多快？测量练习案例研究问题
5.包装管理
包装为何重要？何时不需要包装包装指南描述性版本管理更新日志选择战略包装解决方案本地 Python 打包Debian 打包RPM 包装使用 systemd 进行管理长期运行进程设置systemd 单元文件安装设备日志处理练习案例研究问题
6.持续集成和持续部署
真实世界案例研究：将维护不善的 WordPress 网站转换为雨果网站设置雨果将 WordPress 转为 Hugo Posts创建并更新 Algolia 索引使用 Makefile 进行协调使用 AWS CodePipeline 进行部署真实世界案例研究：使用 Google Cloud Build 部署 Python 应用引擎应用程序真实世界案例研究：NFSOPS
7.监测和记录
构建可靠系统的关键概念不可改变的 DevOps 原则集中登录案例研究：生产型数据库杀死硬盘是自建还是购买？容错监测石墨统计司普罗米修斯仪器命名约定记录为什么很难？基本配置深化配置常见模式ELK 堆栈LogstashElasticsearch 和 Kibana练习案例研究问题
8.Pytest for DevOps
用 pytest 测试超能力pytest 入门使用 pytest 进行测试与 unittest 的区别pytest 功能conftest.py惊人的断言参数化装置入门内置装置基础设施测试什么是系统验证？Testinfra 简介连接远程节点特色和特殊装置实例使用 pytest 测试 Jupyter 笔记本练习案例研究问题
9.云计算
云计算基础云计算的类型云服务的类型基础设施即服务金属即服务平台即服务无服务器计算软件即服务基础设施即代码持续交付虚拟化和容器硬件虚拟化软件定义网络软件定义存储集装箱分布式计算的挑战与机遇云时代的 Python 并发、性能和流程管理流程管理用子流程管理流程使用多重处理解决问题使用 Pool() 分叉进程功能即服务和无服务器使用 Numba 实现高性能 Python使用 Numba 及时编译器使用高性能服务器结论练习案例研究问题

10.基础设施即代码
基础设施自动化工具分类手动调配使用 Terraform 自动配置基础设施配置 S3 存储桶使用 AWS ACM 配置 SSL 证书调配亚马逊 CloudFront 分发配置路由 53 DNS 记录将静态文件复制到 S3删除用 Terraform 提供的所有 AWS 资源利用 Pulumi 自动调配基础设施为 AWS 创建新的 Pulumi Python 项目为暂存堆栈创建配置值配置 ACM SSL 证书配置路由 53 区域和 DNS 记录调配 CloudFront 分发为网站 URL 提供路由 53 DNS 记录创建和部署新堆栈练习
11.容器技术：Docker 和 Docker Compose
什么是 Docker 容器？创建、构建、运行和删除 Docker 映像和容器将 Docker 映像发布到 Docker 注册中心在不同主机上运行具有相同映像的 Docker 容器使用 Docker Compose 运行多个 Docker 容器将 Docker-compose 服务移植到新的主机和操作系统上练习
12.容器协调：Kubernetes
Kubernetes 概念简述使用 Kompose 从 Docker-compose.yaml 创建 Kubernetes 清单基于 minikube 将 Kubernetes Manifest 部署到本地 Kubernetes 集群使用 Pulumi 在 GCP 中启动 GKE Kubernetes 集群将 Flask 示例应用程序部署到 GKE安装 Prometheus 和 Grafana 舵图销毁 GKE 群集练习
13.无服务器技术
向 "三大 "云提供商部署相同的 Python 函数安装无服务器框架向 AWS Lambda 部署 Python 函数将 Python 函数部署到 Google Cloud Functions 中向 Azure 部署 Python 函数在自托管 FaaS 平台上部署 Python 函数向 OpenFaaS 部署 Python 函数使用 AWS CDK 提供 DynamoDB 表、Lambda 函数和 API 网关方法练习
14.MLOps 和机器学习工程
什么是机器学习？监督机器学习建模Python 机器学习生态系统使用 PyTorch 进行深度学习Cloud 机器学习平台机器学习成熟度模型机器学习关键术语第 1 层次：制定框架、确定范围和定义问题第 2 级：持续交付数据第 3 级：持续交付清洁数据第 4 级：持续提供探索性数据分析第 5 级：传统 ML 和 AutoML 的持续交付第 6 层：ML 运行反馈回路使用 Kubernetes 和 Docker 学习 Flask使用 Kubernetes 和 Docker 学习 FlaskEDA建模调整缩放 GBM适合模型评估adhoc_predictJSON 工作流程刻度输入来自 Pickle 的 adhoc_predict刻度输入练习案例研究问题学习评估
15.数据工程
小数据处理小数据文件写入文件读取文件读取和处理线路的发生器管道使用 YAML大数据大数据工具、组件和平台数据来源文件系统数据存储实时流输入案例研究：建立本土数据管道无服务器数据工程将 AWS Lambda 与 CloudWatch 事件结合使用使用 AWS Lambda 进行亚马逊 CloudWatch 日志记录使用 AWS Lambda 填充亚马逊简单队列服务连接 CloudWatch 事件触发器创建事件驱动的 Lambda从 AWS Lambda 读取亚马逊 SQS 事件结论练习案例研究问题
16.DevOps 战争故事与访谈
电影制片厂无法制作电影游戏工作室无法交付游戏Python 脚本启动需要 60 秒用缓存和智能仪器灭火你将自动失业！DevOps 反模式无自动构建服务器反模式盲人飞行难以将协调作为一项持续的成就没有团队精神访谈格伦-所罗门安德鲁-阮加布里埃拉-罗曼里戈贝托-罗切乔纳森-拉库尔维尔-图洛斯约瑟夫-雷斯Teijo Holzer马特-哈里森迈克尔-福德建议练习挑战顶点项目
索引

Content preview from 用于 DevOps 的 Python

第 14 章 MLOps 和机器学习工程

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

机器学习工程师是 2020 年最热门的职称之一。其他热门职称包括数据工程师、数据科学家和机器学习科学家。虽然你可以成为 DevOps 专家，但 DevOps 是一种行为，DevOps 的原则可以应用于任何软件项目，包括机器学习。让我们来看看 DevOps 的一些核心最佳实践：持续集成（Continuous Integration）、持续交付（Continuous Delivery）、微服务（Microservices）、基础设施即代码（Infrastructure as Code）、监控与日志记录（Monitoring and Logging）以及沟通与协作（Communication and Collaboration）。其中哪些不适用于机器学习？

软件工程项目越复杂，机器学习就越复杂，就越需要 DevOps 原则。还有比进行机器学习预测的 API 更合适的微服务实例吗？在本章中，让我们深入探讨如何利用 DevOps 思维以专业、可重复的方式进行机器学习。

什么是机器学习？

机器学习是一种使用算法自动学习数据的方法。主要有四种类型：监督式、半监督式、无监督式和强化式。

监督机器学习

在有监督的机器学习中，正确答案是已知的，并且已经标记。例如，如果您想根据体重预测身高，您可以收集人们身高和体重的示例。身高是目标，体重是特征。

让我们来看看有监督机器学习的例子：

原始数据集
25 000 份 18 岁儿童身高和体重的合成记录

摄取

In[0]:

import pandas as pd

In[7]:

df = pd.read_csv(
  "https://raw.githubusercontent.com/noahgift/\
  regression-concepts/master/\
  height-weight-25k.csv")
df.head()

Out[7]:

索引	高度-英寸	重量-磅
`0`	`1`	`65.78331`	`112.9925`
`1`	`2`	`71.51521`	`136.4873`
`2`	`3`	`69.39874`	`153.0269`
`3`	`4`	`68.21660`	`142.3354`
`4`	`5`	`67.78781`	`144.2971`

EDA

让我们看看这些数据，看看可以探索出什么。

散点图

在本例中，使用了 Python 中流行的绘图库 seaborn 来实现数据集的可视化。如果需要安装，可以通过!pip install seaborn 在笔记本中安装。您也可以通过!pip install <name of package> 安装该部分中的任何其他库。如果您使用的是 Colab 笔记本，我们会为您安装这些库。请参见高度/重量 lm 图（图 14-1）。

In[0]:

import seaborn as sns
import numpy as np

In[9]:

sns.lmplot("Height-Inches", "Weight-Pounds", data=df)

描述性统计

接下来，可以生成一些描述性统计数据。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341657380

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

用于 DevOps 的 Python

by Noah Gift, Kennedy Behrman, Alfredo Deza, Grig Gheorghiu

第 14 章 MLOps 和机器学习工程

什么是机器学习？

监督机器学习

摄取

EDA

散点图

图 14-1. 高度/重量 lm 图

描述性统计

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

《Python 数据分析》第三版

Oracle WebLogic Server 11g Administration Handbook

Oracle WebLogic Server 12c Administration Handbook

ppk on JavaScript

Publisher Resources

第 14 章 MLOps 和机器学习工程

什么是机器学习？

监督机器学习

摄取

EDA

散点图

图 14-1. 高度/重量 lm 图

描述性统计

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

《Python 数据分析》第三版

Oracle WebLogic Server 11g Administration Handbook

Oracle WebLogic Server 12c Administration Handbook

ppk on JavaScript

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.