book

构建机器学习管道

Name: 构建机器学习管道
ISBN: 9798341659292

by Hannes Hapke, Catherine Nelson

May 2025

Intermediate to advanced

366 pages

4h 36m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
序言
什么是机器学习管道？这本书适合哪些人阅读？为什么选择 TensorFlow 和 TensorFlow Extended？章节概览本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.导言
为什么选择机器学习管道？何时考虑机器学习管道机器学习管道步骤概述数据输入和数据版本管理数据验证数据预处理模型训练和调整模型分析模型版本化模型部署反馈回路数据隐私管道协调为什么要进行管道协调？有向无环图我们的示例项目项目结构我们的机器学习模型示例项目的目标摘要
2.TensorFlow 扩展介绍
什么是 TFX？安装 TFXTFX 组件概述什么是 ML 元数据？交互式管道TFX 的替代品Apache Beam 简介设置基本数据管道执行基本管道摘要
3.数据输入
数据输入概念输入本地数据文件输入远程数据文件直接从数据库获取数据数据准备分割数据集跨数据集版本化数据集摄入策略结构化数据解决自然语言问题的文本数据解决计算机视觉问题的图像数据摘要
4.数据验证
为什么要进行数据验证？TFDV安装从数据中生成统计数据从数据生成模式识别数据中的问题比较数据集更新模式数据偏差和漂移有偏差的数据集在 TFDV 中分割数据使用 GCP 处理大型数据集将 TFDV 集成到机器学习管道中摘要
5.数据预处理
为什么要进行数据预处理？在整个数据集的背景下预处理数据扩展预处理步骤避免培训服务偏差将预处理步骤和 ML 模型作为一个工件部署在管道中检查预处理结果使用 TFT 进行数据预处理安装预处理策略最佳做法TFT 功能独立执行 TFT将 TFT 集成到机器学习管道中摘要
6.模型培训
确定示例项目的模式TFX 教练组件run_fn() 函数运行训练器组件其他培训师组件考虑因素在互动管道中使用 TensorBoard分销策略模型调试超参数调整策略TFX 管线中的超参数调整摘要
7.模型分析与验证
如何分析你的模型分类指标回归指标TensorFlow 模型分析在 TFMA 中分析单一模型在 TFMA 中分析多个模型公平性模型分析TFMA 中的切片模型预测用公平指标检查决策阈值更深入地使用 "假设 "工具模型的可解释性使用 WIT 生成解释其他可解释性技术TFX 中的分析和验证解析器节点评估员构成部分评价器组件中的验证TFX 推杆组件摘要
8.使用 TensorFlow 服务部署模型
简单的模型服务器使用基于 Python 的 API 进行模型部署的弊端缺乏代码分离缺乏模型版本控制低效模型推断TensorFlow 服务TensorFlow 架构概述为 TensorFlow 服务导出模型模型签名检查导出模型设置 TensorFlow 服务Docker 安装本地 Ubuntu 安装从源代码构建 TensorFlow 服务配置 TensorFlow 服务器REST 与 gRPC通过模型服务器进行预测通过 REST 获取模型预测通过 gRPC 使用 TensorFlow 服务利用 TensorFlow 服务进行 A/B 模型测试从模型服务器请求模型元数据模型元数据的 REST 请求gRPC 请求模型元数据批量推理请求配置批量预测其他 TensorFlow 服务优化TensorFlow 服务替代品BentoML塞尔登图形管道简单的 TensorFlow 服务MLflowRay Serve使用云提供商进行部署使用案例使用 GCP 部署示例使用 TFX 管道部署模型摘要

9.利用 TensorFlow 服务进行高级模型部署
解耦部署周期工作流程概览优化远程模型加载针对部署的模型优化量化修剪蒸馏将 TensorRT 与 TensorFlow 结合使用TFLite使用 TFLite 优化模型的步骤用 TensorFlow Serving 服务 TFLite 模型监控 TensorFlow 服务实例普罗米修斯设置TensorFlow 服务配置使用 TensorFlow Serving 和 Kubernetes 进行简单扩展摘要
10.高级 TensorFlow 扩展
先进的管道概念同时训练多个模型导出 TFLite 模型热启动模型训练循环中的人类Slack 组件设置如何使用 Slack 组件定制 TFX 组件自定义组件的使用案例从零开始编写自定义组件重复使用现有组件摘要
11.管道第 1 部分：Apache Beam 和 Apache AirflowApache Beam 和 Apache Airflow
选择哪种协调工具？Apache BeamApache 气流控制器Kubeflow 管道人工智能平台上的 Kubeflow 管道将交互式 TFX 管道转换为生产管道光束和气流的简单交互式管道转换Apache Beam 简介利用 Apache Beam 协调 TFX 管道Apache Airflow 简介安装和初始设置基本气流示例用 Apache Airflow 协调 TFX 管线管道设置管道执行摘要
12.管道第 2 部分：Kubeflow 管道
Kubeflow 管道简介安装和初始设置访问您的 Kubeflow 管道安装用 Kubeflow 管道协调 TFX 管道管道设置执行管道Kubeflow 管道的实用功能基于 Google Cloud AI 平台的管道管道设置TFX 管道设置管道执行摘要
13.反馈回路
显性和隐性反馈数据飞轮现实世界中的反馈回路收集反馈的设计模式用户根据预测结果采取某些行动用户评价预测质量用户纠正预测众包注释专家注释自动生成反馈如何跟踪反馈回路跟踪明确反馈跟踪隐性反馈摘要
14.机器学习的数据隐私
数据隐私问题我们为什么关注数据隐私？增加隐私的最简单方法哪些数据需要保密？差异化隐私局部和全局差异隐私伊普西隆、德尔塔和隐私预算机器学习的差异隐私TensorFlow 隐私介绍使用差分私有优化器进行训练计算ε联合学习TensorFlow 中的联合学习加密机器学习加密模型训练将训练好的模型转换为加密预测服务数据隐私的其他方法摘要
15.管道的未来和下一步行动
模型实验跟踪关于模型发布管理的思考未来管道能力TFX 与其他机器学习框架的结合测试机器学习模型机器学习的 CI/CD 系统机器学习工程社区摘要
A.机器学习基础设施简介
什么是集装箱？Docker 简介Docker 映像简介构建第一个 Docker 映像深入了解 Docker CLIKubernetes 简介Kubernetes 的一些定义Minikube 和 kubectl 入门与 Kubernetes CLI 交互定义 Kubernetes 资源向 Kubernetes 部署应用程序
B.在 Google Cloud 上设置 Kubernetes 集群
开始之前谷歌云上的 Kubernetes选择 Google Cloud 项目设置您的 Cloud 项目创建 Kubernetes 集群使用 kubectl 访问 Kubernetes 集群用 kubectl 使用 Kubernetes 集群Kubeflow 管道的持久卷设置
C.操作 Kubeflow 管道的技巧
定制 TFX 图片通过持久卷交换数据TFX 命令行界面TFX 及其附属设备TFX 模板使用 TFX CLI 发布管道
索引

Content preview from 构建机器学习管道

前言

1913 年，亨利-福特的公司建立了第一条移动装配线，生产出传奇的 T 型车，将每辆车的制造时间从 12 小时缩短到 3 小时。这大大降低了成本，使 T 型车成为历史上第一辆平价汽车。这也使得大规模生产成为可能：很快，T 型车就充斥了道路。

由于现在的生产流程是一连串明确定义的步骤（又称流水线），其中一些步骤可以实现自动化，从而节省更多的时间和金钱。如今，汽车大多由机器制造。

但这不仅仅是时间和金钱的问题。对于许多重复性工作，机器会比人类产生更一致的结果，使最终产品更可预测、更一致、更可靠。最后，通过让人类远离重型机械，安全性大大提高，许多工人继续从事更高级别的工作（不过公平地说，还有许多人只是失去了工作）。

另一方面，建立一条装配线可能是一个漫长而昂贵的过程。而且，如果你想生产小批量或高度定制化的产品，这种方式并不理想。福特有句名言："任何客户都可以把汽车涂成他想要的任何颜色，只要是黑色就行"。

过去几十年来，汽车制造的历史在软件行业重演：如今，每一个重要的软件通常都是通过 Jenkins 或 Travis 等自动化工具来构建、测试和部署的。然而，T 型车的比喻已经不够充分了。软件不仅仅是部署后就会被遗忘，还必须定期监控、维护和更新。软件管道现在看起来更像是动态循环，而不是静态生产线。能够快速更新软件（或流水线本身）而不损坏软件是至关重要的。而且，软件的可定制性比 T 型车要强得多：软件可以涂上任何颜色（例如，试着数一数 MS Office 的变体数量）。

遗憾的是，"经典 "自动化工具并不适合处理完整的机器学习管道。事实上，机器学习模型并不是一个普通的软件。

首先，它的大部分行为都是由训练数据驱动的。因此，训练数据本身必须被视为代码（例如，版本化）。这是一个相当棘手的问题，因为每天都会有新的数据出现（通常数量很大），通常会随着时间的推移而演变和漂移，通常包括私人数据，而且在将其输入到监督学习算法之前必须对其进行标注。

其次，模型的行为通常很不透明：它可能在某些数据上通过了所有测试，但在另一些数据上却完全失败。因此，您必须确保您的测试涵盖了生产中将使用模型的所有数据域。尤其是，您必须确保它不会歧视您的用户子集。

由于这些（以及其他）原因，数据科学家和软件工程师最初开始 "在自己的车库里 "手动构建和训练 ML 模型，其中许多人现在仍在这样做。但在过去几年里，人们开发出了新的自动化工具来应对 ML 管道的挑战，例如 TensorFlow Extended (TFX) 和 Kubeflow。越来越多的企业开始使用这些工具来创建 ML 管道，从而将构建和训练 ML 模型的大部分（或全部）步骤自动化。这种自动化的好处大多与汽车行业相同：节省时间和金钱；构建更好、更可靠、更安全的模型；将更多时间用于执行更有用的任务，而不是复制数据或盯着学习曲线。然而，建立 ML 管道并非易事。那么，应该从哪里开始呢？

就在这里

在本书中，Hannes 和 Catherine 提供了开始自动化 ML 管道的清晰指南。作为一个坚信实践方法的人，尤其是对于这样一个技术性话题，我特别喜欢这本书从头到尾一步步指导你完成一个具体示例项目的方式。有了大量的代码示例和简洁明了的解释，您应该很快就能建立并运行自己的 ML 管道，并掌握所有必要的概念工具，以便将这些 ML 管道调整到您自己的使用案例中。我强烈建议你拿起笔记本电脑，边读边实际尝试；这样你会学得更快。

我第一次见到 Hannes 和 Catherine 是在 2019 年 10 月于加州圣克拉拉举行的 TensorFlow ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

What Successful Brick-and-Mortar Retailers Get Right

Publisher Resources

ISBN: 9798341659292

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

构建机器学习管道

by Hannes Hapke, Catherine Nelson

前言

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.