book

构建基于机器学习的应用程序

by Emmanuel Ameisen

May 2025

Beginner to intermediate

260 pages

2h 58m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

使用机器学习应用程序的目标使用 ML 构建实际应用其他资源实用 ML本书内容先决条件我们的案例研究ML 辅助写作ML 流程本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
估计可能出现的情况机型数据构建多语言编辑器尝试用 ML 实现一切：端到端框架最简单的方法作为算法中间地带：总结经验莫妮卡-罗加蒂：如何选择 ML 项目并确定其优先顺序结论
衡量成功业务绩效模型性能保鲜和配送转变速度估算范围和挑战利用领域专长站在巨人的肩膀上多语言编辑器规划编辑的初步计划始终从简单模型开始要想定期取得进步：从简单开始从简单的管道开始多语言编辑器管道结论
最简单的脚手架多语言编辑器原型解析和清理数据文本标记化生成功能测试工作流程用户体验建模结果多语言编辑器原型评估模型用户体验结论
迭代数据集数据科学探索第一个数据集提高效率，从小事做起见解与产品数据质量评分标准查找数据趋势的标签统计摘要高效探索和标签成为算法数据趋势让数据为功能和模型提供依据从模式中构建功能多语言编辑器功能罗伯特-芒罗：如何查找、标记和利用数据？结论
最简单合适的模式简单模型从模式到模型分割数据集ML 编辑器数据分割评委表现评估您的模型：超越准确性数据与预测对比混淆矩阵ROC 曲线校准曲线误差降维Top-k 方法其他型号评估特征重要性直接来自分类器黑盒子讲解器结论
软件最佳实践特定于 ML 的最佳实践调试布线：可视化和测试从一个例子开始测试您的 ML 代码调试培训：让您的模型学会学习任务难度优化问题调试通用化：让你的模型有用数据泄漏过度拟合考虑手头的任务结论

从模型中提取建议没有模型，我们能做什么？提取全局特征重要性使用模型得分提取本地特征的重要性机型比较版本 1：成绩单版本 2：更强大，更模糊第 3 版：可以理解的建议生成编辑建议结论
数据问题数据所有权数据偏差系统偏差建模问题反馈回路包容性模型性能考虑背景对手滥用问题和双重用途克里斯-哈兰德航运实验结论
服务器端部署流媒体应用程序或应用程序接口批次预测客户端部署在设备上浏览器端联合学习：混合方法结论
围绕故障开展工程设计输入和输出检查模型故障回退性能工程师扩展至多个用户模型和数据生命周期管理数据处理和 DAG征求反馈意见克里斯-穆迪增强数据科学家部署模型的能力结论
监测拯救生命监测以告知刷新率监测以发现滥用选择监控内容性能指标业务指标针对 ML 的 CI/CDA/B 测试和实验其他方法结论

Content preview from 构建基于机器学习的应用程序

第 10 章为模型建立保障

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

当设计数据库或分布式系统时，软件工程师关注的是容错性，即当系统的某些组件发生故障时，系统继续工作的能力。在软件中，问题不在于系统的某个部分是否会发生故障，而在于何时发生故障。同样的原则也适用于 ML。无论模型有多好，它都会在某些示例中失效，因此您应该设计一个能够从容应对此类故障的系统。

在本章中，我们将介绍有助于防止或减轻故障的不同方法。首先，我们将了解如何验证我们接收和生成的数据的质量，并利用这种验证来决定如何向用户显示结果。然后，我们将了解如何使建模管道更加强大，以便能够高效地为众多用户提供服务。之后，我们将了解利用用户反馈和判断模型性能的方法。在本章的最后，我们将就部署最佳实践采访 Chris Moody。

围绕故障开展工程设计

让我们在上介绍一下 ML 管道最有可能出现故障的几种方式。细心的读者会发现，这些失败案例与我们在"调试布线：可视化和测试 "中看到的调试技巧有些类似。事实上，在生产中向用户公开模型会遇到一系列挑战，这些挑战与调试模型时遇到的挑战如出一辙。

Bug 和错误可能出现在任何地方，但有三个方面尤其需要验证：流水线的输入、模型的置信度及其产生的输出。让我们按顺序逐一讨论。

输入和输出检查

任何给定的模型都是在具有特定特征的特定数据集上训练出来的。训练数据具有一定数量的特征，每个特征都有一定的类型。此外，每个特征都遵循特定的分布，模型学习了这些分布才能准确执行。

正如我们在"新鲜度和分布偏移 "一文中所看到的，如果生产数据与模型所训练的数据不同，模型可能难以执行。为了解决这个问题，您应该检查管道的输入。

检查输入

一些模型在面对数据分布的微小差异时仍能表现出色。但是，如果模型接收到的数据与训练数据差别很大，或者某些特征缺失或属于意想不到的类型，那么模型的表现就会大打折扣。

正如我们之前所看到的，即使输入不正确，ML 模型也能运行（只要这些输入的形状和类型正确）。模型会产生输出，但这些输出可能普遍不正确。请看图 10-1 中的示例。一个管道通过首先将句子矢量化，然后在矢量化表示上应用分类模型，将句子分类为两个主题之一。如果管道接收到一串随机字符，它仍会将其转换为向量，然后模型会做出预测。这种预测是荒谬的，但仅仅通过观察模型的结果是无法得知的。