Book description
正如自动化流水线给汽车制造业带来了质的改变,自动化机器学习流水线也能从根本上加速机器学习领域的发展。机器学习流水线实现了复用、管理和部署机器学习模型的标准化流程。数据科学家和机器学习工程师不仅能摆脱逐个手动构建和训练模型的“作坊式”工作流程,还能产出更可靠、更安全的模型。
本书带领你使用TensorFlow生态圈中的众多工具构建可复现的机器学习流水线,从而将模型部署时间从数天缩短为数分钟,有效地实现机器学习项目产品化。你将学习如下内容。
- 了解机器学习流水线的构建步骤
- 使用TensorFlow Extended(TFX)构建机器学习流水线
- 使用Beam、Airflow、Kubeflow Pipelines编排流水线
- 数据校验和数据预处理
- 使用TensorFlow的模型分析工具
- 检查模型的公平性
- 使用TensorFlow Serving和TensorFlow Lite部署模型
- 了解差分隐私、联邦学习和加密机器学习等隐私保护方法
Table of contents
- 封面
- 扉页
- 版权
- 版权声明
- O'Reilly Media, Inc.介绍
- 目录 (1/2)
- 目录 (2/2)
- 本书赞誉
- 序
- 前言
- 第1章 入门
- 第2章 TensorFlow Extended入门
- 第3章 数据读取
- 第4章 数据校验
- 第5章 数据预处理
- 第6章 模型训练
- 第7章 模型分析和验证
-
第8章 用TensorFlow Serving部署模型
- 8.1 简单的模型服务器
- 8.2 基于Python API部署模型的缺点
- 8.3 TensorFlow Serving
- 8.4 TensorFlow Serving架构概述
- 8.5 为TensorFlow Serving导出模型
- 8.6 模型签名
- 8.7 查看导出的模型
- 8.8 创建TensorFlow Serving
- 8.9 配置TensorFlow服务器
- 8.10 REST与gRPC
- 8.11 用模型服务器预测
- 8.12 用TensorFlow Serving进行模型A/B测试
- 8.13 从模型服务器获取模型元数据
- 8.14 批量推算请求
- 8.15 配置批量预测
- 8.16 其他TensorFlow Serving优化方法
- 8.17 TensorFlow Serving的替代品
- 8.18 在云服务上部署
- 8.19 使用TFX流水线进行模型部署
- 8.20 小结
- 第9章 使用TensorFlow Serving进行进阶模型部署
- 第10章 TensorFlow Extended的高级功能
- 第11章 流水线第一部分:Apache Beam和Apache Airflow
- 第12章 流水线第二部分:Kubeflow Pipelines
- 第13章 反馈循环
- 第14章 机器学习的数据隐私
- 第15章 流水线的未来和下一步
- 附录A 机器学习基础架构简介 (1/3)
- 附录A 机器学习基础架构简介 (2/3)
- 附录A 机器学习基础架构简介 (3/3)
- 附录B 在谷歌云上设置Kubernetes集群 (1/2)
- 附录B 在谷歌云上设置Kubernetes集群 (2/2)
- 附录C 操作Kubeflow Pipelines的技巧 (1/2)
- 附录C 操作Kubeflow Pipelines的技巧 (2/2)
- 关于作者
- 关于封面
Product information
- Title: 机器学习流水线实战
- Author(s):
- Release date: November 2021
- Publisher(s): Posts & Telecom Press
- ISBN: 9787115573216
You might also like
book
大数据项目管理:从规划到实现
许多公司会在大数据项目的实施细节上下很多功夫,例如研究分布式处理引擎和数据分析算法。这并没有错,但不要因为一棵树而错过整片森林。本书将为你打开更广阔的视野,展示如何从大数据项目的规划阶段开始,一步步走向成功。无论是首席信息官、首席技术官、项目经理,还是架构师和开发人员,都能通过本书得到 启迪。 开始规划:思考大数据项目的主要类型 评估和选择数据管理解决方案 降低与技术、团队、需求相关的风险 探索良好的接口设计模式 为项目选择合适的分布式存储系统 规划和实施元数据收集 使用数据管道确保数据完整性 根据并行处理引擎的特征评估处理框架
book
精通機器學習
建立智慧系統的概念、工具與技術 “這是一本卓越的機器學習資源,有清楚、直觀的解說,以及大量實用技巧。” —François Chollet Keras作者,《Deep Learning with Python》作者 “這本書詳細介紹以神經網路解決問題的理論與做法;建議想要實際運用ML的人都要看這本書。” —Pete Warden TensorFlow行動主管 深度學習經歷了一系列的突破之後,已經大幅推動了整個機器學習領域,如今,即使你對這項技術一無所知,也可以使用簡單、高效的工具,製作可從資料中學習的程式。這本暢銷書新版本使用具體的案例、精簡的理論,以及Python準生產框架,協助你直觀地認識智慧系統的概念與建構工具。 你將學到可快速上手的技術,只要具備程式編寫經驗,就可以藉由各章的習題來學習。你可以在GitHub取得本書的所有程式碼,這些程式已經更新為TensorFlow 2,以及最新版的Scikit-Learn。 使用Scikit-Learn與pandas,透過端對端專案建立機器學習基礎 …
book
Go程序设计语言
本书由《C程序设计语言》的作者Kernighan和谷歌公司Go团队主管Alan Donovan联袂撰写,是学习Go语言程序设计的权威指南。本书共13章,主要内容包括:Go的基础知识、基本结构、基本数据类型、复合数据类型、函数、方法、接口、goroutine、通道、共享变量的并发性、包、go工具、测试、反射等。
book
商战数据挖掘:你需要了解的数据科学与分析思维
在现代社会中,数据即商业,它是提升生产力、促进创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,进而用数据科学方法解决商业问题,做出精准的决策。