
连接模式
|
367
对于模型的产品化有许多考虑因素和设计决策。和之前一样,在发现阶段做出的许
多决策也会指导这一步。模型再训练应该如何管理?输入数据需要流处理吗?训练
是针对新批次的数据进行还是实时进行的?模型推理呢?我们应该每周执行一次批
处理推理作业还是需要支持实时预测?是否存在特殊的吞吐量或延迟问题需要考
虑?是否需要处理高强度的工作负载?低延迟是要优先考虑的吗?网络连接性是个
问题吗?第
5
章中的设计模式涉及了一些在运作机器学习模型时出现的问题。
这些都是重要的考虑因素,而对于许多业务来说最后阶段往往是最大的障碍,因为
它需要组织的不同部门之间强有力的协调以及各种技术组件的集成。这种困难的部
分原因还在于,产品化过程需要将一个依赖于机器学习模型的新过程集成到现有的
系统。这可能涉及处理为支持单一方法而开发的遗留系统,或者可能需要在组织内
进行复杂的变更控制和生产过程。而且,许多时候,现有的系统没有一种机制来支
持来自机器学习模型的预测,所以必须开发新的应用和工作流。预见到这些挑战很
重要,开发一个全面的解决方案需要来自业务运作方面的大量投入,以尽可能容易
地完成过渡,并加快进入市场的速度。
部署阶段的下一步是运作模型(图
8-2
的步骤
9
)。这一实践领域通常被称为
MLOps
(
ML Operations
,机器学习运维),涵盖了自动化、监控、测试、管理和维护生产
中的机器学习模型的相关方面。对于任何希望扩大组织内部机器学习驱动的应用数
量的公司来说,这都是一个必要的组成部分。
操作化模型的一个关键特点是自动化工作流 ...