book

可解释人工智能实践指南

Name: 可解释人工智能实践指南
ISBN: 9798341659445

by Michael Munn, David Pitman

May 2025

Intermediate to advanced

278 pages

3h 31m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
序言
谁应该阅读这本书？本书有哪些内容？代码样本本书导航本书使用的约定O'Reilly 在线学习如何联系我们致谢
1.导言
为什么选择可解释的人工智能什么是可解释的人工智能？谁需要可解释性？可解释性方面的挑战评估可解释性如何使用可解释性？LinkedIn 如何使用可解释的人工智能普华永道将可解释人工智能用于汽车保险理赔埃森哲实验室解读贷款决策DARPA 利用可解释人工智能打造 "第三波人工智能"摘要
2.可解释性概述
什么是解释？可解释性和可说明性可解释性消费者从业人员--数据科学家和 ML 工程师观察员--企业利益相关者和监管机构最终用户--领域专家和受影响用户解释类型建模前的可解释性内在可解释性与事后可解释性地方、群体和全球解释归因、反事实和基于实例的解释贯穿可解释性的主题功能归属代用模型激活将所有内容整合在一起摘要
3.表格数据的可解释性
排列特征重要性从零开始的排列特征重要性scikit-learn 中的排列特征重要性夏普利价值观SHAP（夏普利添加剂配方）可视化局部特征归因全局特征属性可视化从夏普利值解读特征归因管理的夏普利值解释树状模型从决策树到树集合SHAP 的树木解说器部分依存图和相关图偏倚图 (PDP)个人条件期望图 (ICE)当地累积效应 (ALE)摘要
4.图像数据的可解释性
综合梯度 (IG)选择基线累积梯度综合梯度的改进XRAIXRAI 如何工作实施 XRAIGrad-CAMGrad-CAM 的工作原理实施 Grad-CAM改进 Grad-CAMLIMELIME 如何工作实施 LIME引导反向传播和引导 Grad-CAM有向导的反向推进和 DeConvNets分级-CAM 指导摘要
5.文本数据的可解释性
使用文本构建模型概述令牌化词嵌入和预训练嵌入LIMELIME 如何处理文本梯度 x 输入线性模型的直觉从线性模型到非线性模型和文本模型Grad L2-norm图层综合渐变综合梯度的变体层相关性传播（LRP）LRP 如何工作从注意力中得出解释使用哪种方法？语言可解释性工具摘要
6.高级和新兴专题
其他可解释性技术替代输入归属设计的可解释性其他模式时间序列数据多模式数据可解释性技术评估理论方法经验方法摘要
7.与可解释的人工智能互动
谁在使用可解释性？如何有效地提出解释明确 ML 执行的内容、方式和原因准确表述解释以 ML 消费者的现有理解为基础使用可解释性的常见误区假设因果关系过度拟合模型的意图过度解释摘要
8.将所有内容整合在一起
在建设时考虑可解释性多语言生命周期人工智能法规与可解释性值得期待的可解释人工智能自然解释和语义解释询问式解释有针对性的解释摘要

A.分类、技术和延伸阅读
ML 消费者可解释性分类法XAI 技术表格模型图像模型文本模型先进和新兴技术与可解释性互动将所有内容整合在一起更多阅读可解释的人工智能与可解释性互动XAI 技术的技术准确性XAI 技术的脆性用于 DNN 的 XAI
索引
关于作者

Content preview from 可解释人工智能实践指南

第 6 章. 高级和新兴课题

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

与 Sheeraz Ahmad

到目前为止，本书的重点一直放在成熟的技术、模式和使用案例上。然而，可解释人工智能（XAI）仍然是一个活跃的研究领域，因此新技术在不断开发，现有技术也在不断改进和细化。前几章介绍的基于特征的解释（如夏普利值和综合梯度）可以涵盖许多用例，尤其是应用于文本、表格和图像数据时。不过，在特定情况下，还有一些新兴技术和主题对你的可解释性工具箱很有价值。

在本章中，我们将讨论三个广泛的新兴话题。首先，我们将介绍其他解释技术，如输入归因（而不是特征归因）和通过设计使模型可解释。其次，我们将简要介绍如何将之前介绍的一些技术更普遍地应用于非文本、表格或图像的数据格式，特别是侧重于时间序列和多模态数据（文本+图像）。第三，我们将讨论如何系统地评估可解释性技术，而不是对少数数据点进行抽查。

其他可解释性技术

在本节中，我们将讨论两种可解释性替代方法，即交替输入归因法，即归因于训练数据点或用户定义的概念；以及设计可解释性，即对建模过程进行干预，使其在本质上更具可解释性。

替代输入归属

虽然基于示例特征的推理是接近可解释性的合理方法，但预测也可以归因于其他输入，如训练数据中的其他示例或某些补充数据中的示例。请注意，特征归因也会受到训练数据的间接影响，因为训练数据毕竟是模型用来学习任务的数据，而特征归因技术需要以各种方式查询训练过的模型。然而，这种间接影响（训练数据 → 模型 → 特征归因）很难追溯，这使得我们很难回答正确（或错误）的预测应该归因于训练数据中的哪个点。

现在，我们将讨论一些技术，这些技术可以让我们将功劳（或责任）直接归因于训练集中的单个数据点，或归因于由领域专家策划的补充集中的数据。我们将讨论三大类替代输入归因方法：基于示例的解释、影响函数和基于概念的解释。基于示例的解释通过浮现训练数据集中被模型视为相似（或不同）的元素，让我们深入了解模型的行为。基于影响函数的解释也利用数据集中的示例，但侧重于那些对模型行为有重大影响的示例。在这里，一个训练示例的影响是通过如果将该示例从训练数据集中移除，模型参数或预测会发生多大变化来衡量的。最后，基于概念的解释使用模型的内部状态来比较高层次的抽象概念与输入实例和模型预测的比较。这样做的好处是，这些概念比单个特征更符合人类的直觉。

基于实例的解释

以下是您需要了解的基于示例的解释：

通过对模型实例进行基于近邻的近似解释，，从而深入了解模型行为。
它们同样适用于不同的数据模式--图像、文本和表格。
基于实例的解释主要被认为是与模型无关的，它根据数据集的要素而不是模型特征提供解释。
反事实解释是一种基于实例的解释。

优点

缺点

这些解释对于调试模型以及与利益相关者建立闭环非常有用。
它们是一种非常直观的、人类可以理解的模型行为表示法。
基于实例的解释有助于建立一个心智模型来理解你的 ML 模型预测，并对复杂的数据分布提供额外的洞察力，揭示隐藏的数据问题或异常值。
使用ScaNN 等开源库生成基于示例的解释，上手很快。

基于示例的归因并不能保证完整性--将每个训练数据点与给定测试点的距离相加，并不能得出有意义的总和。
这些解释并不能深入揭示测试点与相应的基于示例的解释之间的因果关系。
要在本地扩展基于示例的解释，难度可能会超过 ~1-10K 个示例；超过这个数量，您就需要使用云服务了。

基于实例的解释是传达模型推理的一种直观方式。与特征归因的目的是将预测的部分责任分配给单个特征类似，基于示例的解释的目的也是将预测的部分责任分配给训练数据中的单个点。例如，对于 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341659445

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

可解释人工智能实践指南

by Michael Munn, David Pitman

第 6 章. 高级和新兴课题

其他可解释性技术