book

在企业中实施 MLOps

Name: 在企业中实施 MLOps
ISBN: 9798341657106

by Yaron Haviv, Noah Gift

May 2025

Intermediate to advanced

380 pages

4h 56m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
本书适合人群本书导航本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢亚伦诺亚
1.MLOps：它是什么，我们为什么需要它？
什么是 MLOps？企业中的 MLOps了解企业解决方案的投资回报率了解企业的风险和不确定性MLOps 与 DevOps 的比较什么不是 MLOps？MLOps 的主流定义什么是 ML 工程？MLOps 和企业激励措施云中的 MLOps关键云开发环境云计算的主要参与者MLOps 内部部署混合环境中的 MLOps企业 MLOps 战略结论批判性思维讨论问题练习
2.MLOps 的各个阶段
入门选择算法设计您的管道数据收集和准备数据存储和输入数据探索与准备数据标签特色商店模型开发与培训编写和维护生产型 ML 代码跟踪和比较实验结果分布式训练和超参数优化建立和测试生产模型部署（和在线 ML 服务）从模型端点到应用管道在线数据准备持续模型和数据监测监测数据和概念漂移监测模型性能和准确性预训练模型的策略构建端到端 "拥抱脸 "应用程序流程自动化（ML 的 CI/CD）结论批判性思维讨论问题练习
3.开始第一个 MLOps 项目
确定业务用例和目标寻找人工智能用例确定目标和评估投资回报率如何打造成功的 ML 项目批准项目并制作原型项目规模化和产品化项目结构和生命周期从 A 到 Z 的 ML 项目实例探索性数据分析数据和模型管道开发应用管道开发项目规模化和产品化CI/CD 和持续运营结论批判性思维讨论问题练习
4.使用数据和特征库
数据版本化和沿袭如何使用常见的 ML 数据版本管理工具大规模数据准备和分析结构化和非结构化数据转换分布式数据处理架构交互式数据处理批量数据处理流处理流处理框架特色商店功能存储架构和使用输入和转换服务功能存储特征检索（用于培训和服务）功能商店解决方案和使用示例使用 Feast 功能商店使用 MLRun 功能存储结论批判性思维讨论问题练习
5.开发生产模型
AutoML运行、跟踪和比较 ML 作业实验跟踪用模型工件保存重要元数据比较 ML 工作：以 MLflow 为例超参数调整自动记录MLOps 自动化：AutoMLOps示例：使用 Azure Databricks 运行和跟踪 ML 作业处理大规模培训构建和运行多阶段工作流程高效管理计算资源结论批判性思维讨论问题练习
6.模型和人工智能应用的部署
模型登记和管理解决方案示例SageMaker 示例MLflow 示例MLRun 示例服务模式亚马逊 SageMaker塞尔登核心MLRun 服务高级服务和应用管道实施可扩展的应用程序管道模型路由和集合模型优化和 ONNX数据和模型监测综合模型监测解决方案独立模型监测解决方案模型再训练何时重新训练模型数据再培训策略MLOps 管道中的模型再训练部署战略衡量业务影响结论批判性思维讨论问题练习
7.从 A 到 Z 建立一个生产级 MLOps 项目
探索性数据分析交互式数据准备准备信贷交易数据集准备用户事件（活动）数据集提取标签和训练模型使用特征库进行数据输入和准备建立信用交易数据管道（功能集）构建用户事件数据管道（功能集）构建目标标签数据管道（特征集）将数据输入特征库模型训练和验证流程创建和评估特征向量构建并运行自动培训和验证管道实时应用管道定义自定义模型服务类利用增益和集合构建应用管道本地测试应用程序管道部署和测试实时应用程序管道模型监测CI/CD 和持续运营结论批判性思维讨论问题练习
8.构建可扩展的 Deep Learning 和大型语言模型项目
分布式深度学习HorovodRayDL 中的数据收集、标记和监测应避免的数据标签陷阱数据标签最佳做法数据标签解决方案将基础模型用作标签使用非结构化数据监控 DL 模型构建与购买 Deep Learning 模型基础模型、生成式人工智能、LLMs生成式人工智能的风险与挑战高效使用和定制 LLMs 的 MLOps 管道应用实例：微调 LLM 模型结论批判性思维讨论问题练习
9.高级数据类型的解决方案
利用时间序列构建 ML 问题框架使用 AWS 导航时间序列分析使用 DeepAR+ 深入研究时间序列使用 GCP BigQuery 和 SQL 进行时间序列分析MLOps NLP 问题的构建与购买对比建造与购买：抱脸法使用 AWS 探索自然语言处理用 OpenAI 探索 NLP视频分析、图像分类和生成式人工智能使用 CreateML 的图像分类技术复合人工智能使用无服务器入门复合人工智能无服务器复合人工智能使用案例结论批判性思维讨论问题练习

10.使用 Rust 实现 MLOps
为 MLOps 引入 Rust 的理由使用 Rust、GitHub Copilot 和代码空间提升水平最初的命令行入门 Rust for MLOps使用 PyTorch 和 Rust 的抱抱脸使用 Rust 为 MLOps 打造工具构建容器化的 Rust 命令行工具GPU PyTorch 工作流程使用 TensorFlow Rust用 Rust 进行 k 均值聚类关于 Rust 的最后说明围脖衬垫Rust-new-project-template结论批判性思维讨论问题练习
A.工作面试问题
B.企业 MLOps 访谈
索引
关于作者

Content preview from 在企业中实施 MLOps

第 5 章. 开发生产模型

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

开发 ML 模型不再局限于实验室实验和研究论文。它关系到现实世界的应用，也就是生产。这就是为什么建立高性能模型是开发生产模型的核心所在。

生产第一的思维模式可以确保模型真正投入生产并回答实际业务案例。否则，由于团队之间缺乏协作、技术差异或其他类型的摩擦，模型会在整个 ML 管道中被卡住。

本章重点介绍如何构建最佳模型。它详细介绍了在生产之前在整个 ML 管道中实施和运行模型的所有步骤和流程。这包括大规模运行、跟踪和比较 ML 作业、自动化、训练和 ML；测试；资源管理等等。它详细介绍了各种方法论、工具和途径，并附有可供参考的代码示例。

在按照本章结尾的步骤进行操作和尝试练习时，请注意整个 MLOps 流程，以及如何将您的工作与您或其他团队成员正在采取的其他步骤整合在一起并实现自动化。在采取这些步骤时，要牢记 "生产第一 "的原则，这样才能确保 ML 模型的可靠性、稳定性和性能。

AutoML

建立最佳 ML 模型是一个依靠数据科学经验和直觉的迭代过程。数据科学家会尝试各种策略，如从数据中创建新特征、选择合适的算法以及选择最佳模型参数，以获得最佳预测模型。

自动机器学习（或 AutoML）试图从数据和模型目标中自动推断出可能的处理任务和实验，这些任务和实验应按顺序进行测试和运行，直到获得最佳模型结果。AutoML 可以减少数据科学家的工作量，让经验不足的人也能快速高效地开发出高性能的 ML 模型。不过，这可能会导致使用更多的计算资源。

AutoML 平台和工具旨在通过自动化重复而复杂的任务，简化构建 ML 模型的流程。

AutoML 的主要组件包括

数据预处理: 数据清理、缺失值归因、分类变量编码和特征缩放等任务，为数据建模做好准备。
功能工程: 自动生成和选择相关特征或特征变换，以提高模型性能。
机型选择: 针对给定的数据集和问题，探索和选择合适的算法或模型。这可能包括尝试各种类型的模型（如决策树、神经网络或 SVM）并评估其性能。
超参数调整: 为模型选择最佳超参数。这可能涉及网格搜索、随机搜索、贝叶斯优化或其他优化算法等技术。
组合方法: 结合多个模型的预测结果，提高整体性能。
模型评估: 使用准确率、精确度、召回率、F1 分数等指标，帮助用户评估模型的有效性。
管道建设: 构建从数据预处理到模型部署的端到端流水线，使用户能够生成生产就绪的工作流。
可解释性和可说明性: 为模型预测提供解释，帮助用户理解和解释模型是如何做出决定的。

DataRobot 公司成立于 2012 年，是 AutoML 领域的先驱之一。2017/2018 年，其他公司接踵而至：拥有无人驾驶人工智能平台的 H2O 和拥有Cloud AutoML 等技术的谷歌。随后很快扩展到其他云提供商：Azure Machine Learning Studio AutoML；SageMakerAutopilot；以及Auto-sklearn、Auto-Keras、基于树的管道优化工具（TPOT）、MLBox、AutoGluon、AutoWEKA 和Ludwig 等一系列开源项目。

AutoML 的一些优点包括

效率: 自动执行特征选择和超参数调整等重复性任务。
无障碍环境: 友好的用户界面使非专家也能使用机器学习。
成本效益: 减少对专业人才的需求，使成本更低。
提高准确性: 得益于先进的自动模型调整算法。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341657106

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

在企业中实施 MLOps

by Yaron Haviv, Noah Gift

第 5 章. 开发生产模型

AutoML

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.