book

机器学习在高风险应用中的应用

by Patrick Hall, James Curtis, Parul Pandey

May 2025

Beginner to intermediate

470 pages

5h 43m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

谁应该阅读这本书读者将学到什么与 NIST 人工智能风险管理框架保持一致图书大纲第一部分第二部分第三部分示例数据集台湾信贷数据Kaggle 胸部 X 射线数据本书使用的约定在线数字使用代码示例O'Reilly 在线学习如何联系我们致谢帕特里克-霍尔詹姆斯-柯蒂斯帕鲁尔-潘迪
法律与监管环境掠影欧盟人工智能法案提案美国联邦法律法规州和市政法律基本产品责任联邦贸易委员会执法权威的最佳做法人工智能事件机器学习风险管理的文化能力组织问责制有效挑战的文化经验丰富的多元化团队喝我们自己的香槟快速行动，打破常规机器学习风险管理的组织流程预测故障模式模型风险管理程序超越模型风险管理案例研究：Zillow iBuying 的兴衰史辐射经验教训资源
可解释性和可说明性的重要理念可解释模型加法模型决策树可解释的机器学习模型生态系统事后解释功能归属和重要性代用模型模型性能图集群剖析事后解释在实践中的顽疾可解释模型与事后解释配对案例研究：按算法分级资源
培训重现性数据质量现实世界成果的模型规范模型调试软件测试传统模式评估常见的机器学习错误残差分析敏感性分析基准模型补救：修复漏洞部署域名安全模型监测案例研究：死于自动驾驶汽车辐射准备不足的法律体系经验教训资源
ISO 和 NIST 对偏差的定义系统偏差统计偏差人类偏见与数据科学文化美国关于反洗钱偏见的法律概念哪些人容易受到 ML 系统的偏见影响人们经历的伤害偏差测试测试数据传统方法：测试等效结果新思维：测试等效性能质量地平线上：更广泛的 ML 生态系统测试测试计划摘要减少偏见减少偏见的技术因素科学方法与实验设计减少偏差的方法减少偏见的人为因素案例研究：Bias Bug Bounty资源
安全基础知识对抗心态中情局三合会数据科学家的最佳实践机器学习攻击完整性攻击：操纵机器学习输出保密性攻击：提取信息一般 ML 安全问题对策安全模型调试安全模式监控隐私增强技术稳健的机器学习一般对策案例研究：真实世界的规避攻击规避攻击经验教训资源
概念复习：机器学习透明度相加性与相互作用利用约束条件实现因果关系的步骤部分依赖性和个人条件预期夏普利价值观模型文档可解释模型的 GAM 系列采用 Alpha 和 Lambda 搜索的弹性网络惩罚性 GLM广义加法模型GA2M 和可解释推进器带约束的 XGBoost 和事后解释有约束和无约束 XGBoost用部分依赖性和 ICE 解释模型行为作为一种解释技术的决策树代用模型夏普利值解释夏普利值的问题更明智的模型选择资源

解释胸部 X 射线分类概念复习：可解释模型和事后解释技术可解释模型概述闭塞方法基于梯度的方法用于模型调试的可解释人工智能可解释模型ProtoPNet 及其变体其他可解释的深度学习模型训练和解释 PyTorch 图像分类器培训数据解决数据集失衡问题数据扩增和图像裁剪模型培训评估和衡量标准使用 Captum 生成事后解释评估模型解释事后解释的稳健性结论资源
概念复习：调试 ML机型选择敏感性分析残差分析补救措施选择更好的 XGBoost 型号XGBoost 的灵敏度分析XGBoost 压力测试压力测试方法修改数据以模拟衰退状况对抗性示例搜索XGBoost 的残差分析残差分析与可视化分段误差分析残差建模对选定模式进行补救过分强调 PAY_0杂项错误结论资源
概念复习：调试 Deep Learning调试 PyTorch 图像分类器数据质量和泄漏深度学习的软件测试深度学习的敏感性分析补救措施灵敏度修复结论资源
概念复习：管理 ML 偏差模型培训评估模型的偏差小组测试方法个人公平代理偏见纠正偏见预处理处理中后期处理机型选择结论资源
概念复习中情局三合会攻击对策模型培训红队攻击模型提取攻击对抗性实例攻击成员攻击数据中毒后门结论资源
谁在房间里？科学与工程数据科学方法科学方法对已公布结果和索赔的评估应用外部标准常识性风险缓解结论资源

Content preview from 机器学习在高风险应用中的应用

第 10 章. 使用 XGBoost测试和纠正偏差

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

本章介绍结构化数据的偏差测试和修复技术。第 4 章从不同角度讨论了有关偏差的问题，而本章则侧重于偏差测试和修复方法的技术实现。首先，我们将在信用卡数据的变体上训练 XGBoost。然后，我们将通过检查不同人口群体的性能和结果差异来测试是否存在偏差。我们还将尝试在单个观察结果层面识别任何偏差问题。一旦我们确认模型预测中存在可测量的偏差水平，我们就会开始尝试修复或纠正这种偏差。我们将采用前处理、中处理和后处理补救方法，分别尝试修复训练数据、模型和结果。在本章的最后，我们将进行具有偏见感知能力的模型选择，从而得到一个性能比原始模型更好、更公平的模型。

虽然我们已经清楚，技术测试和偏差修复并不能解决机器学习偏差问题，但它们在有效的整体偏差缓解或 ML 治理计划中仍然发挥着重要作用。虽然模型中的公平分数并不能直接转化为已部署的 ML 系统中的公平结果--原因有很多--但有公平分数总比没有好。我们还认为，测试对人进行操作的模型是否存在偏差，是从业数据科学家的一项基本而明显的道德义务。我们之前提到的另一个主题是，未知风险比已知风险更难管理。当我们知道一个系统可能存在偏差风险和危害时，我们可以尝试补救这种偏差，监控系统是否存在偏差，并应用多种不同的社会技术风险控制措施（如漏洞悬赏或用户访谈）来减轻任何潜在的偏差。

备注

本章重点讨论相当传统的分类器的偏差测试和补救，因为这是最容易理解这些主题的地方，而且许多复杂的人工智能结果往往归结为最终的二进制决策，可以用与二进制分类器相同的方式来处理。我们还将在本章中重点介绍回归模型的技术。关于如何管理多项式、无监督或生成系统中的偏差，请参见第 4 章。

在本章结束时，读者应该了解如何测试模型是否存在偏差，然后选择一个偏差较小但性能良好的模型。虽然我们承认没有解决 ML 偏差的灵丹妙药，但对于高风险应用来说，一个更公平、性能更好的模型比一个未经偏差测试或补救的模型更好。本章的代码示例可在线获取。

概念复习：管理 ML 偏差

在深入学习本章的案例研究之前，让我们先快速复习一下第 4 章中的相关主题。第 4 章中最需要强调的一点是，所有的 ML 系统都是社会技术性的，我们在本章中关注的那种纯技术性测试无法捕捉到 ML 系统可能产生的所有不同偏差问题。一个简单的事实是，在一两个数据集上测得的模型 "公平 "分数完全不能反映系统的偏差。其他问题可能来自于未代表的用户、可访问性问题、物理设计错误、系统的下游误用、对结果的曲解等等。

警告

偏差测试和缓解的技术方法必须与社会技术方法相结合，才能充分解决潜在的偏差危害。我们不能忽视自己团队的人口统计背景、用户或培训和测试数据中的用户的人口统计、数据科学文化问题（如 "摇滚明星 "的称谓）以及高度发达的法律标准，同时还期望解决 ML 模型中的偏见问题。本章主要侧重于技术方法。第 4 章试图描述一种更广泛的社会技术方法来管理ML 中的偏差。

我们必须加强技术偏差测试和补救工作，全面致力于让不同的利益相关者参与到 ML 项目中来，并坚持采用系统化的方法来开发模型。我们还需要与用户沟通，并遵守模型管理，让人类对我们实施和部署的计算机系统的决策负责。直截了当地说，这类社会技术风险控制可能比本章讨论的技术控制更重要、更有效。

尽管如此，我们还是不希望部署明显带有偏见的系统，如果我们能让技术变得更好，我们就应该这样做。减少偏差的 ML ...