
负责任的人工智能
|
329
模型中,无信息基线可以是用于模型嵌入矩阵的
0
值或像“
the
”“
is
”或“
and
”这
样的停止词。在一个采用数值输入的模型中,选择基线的一个通用方法是使用模型
中每个特征的中值进行预测。
确定基线
我们考虑基线的方式将根据模型执行的是回归任务还是分类任务而有所区别。
对于一个回归任务,模型将只有一个数值基线预测值。在汽车里程的例子中,
假设我们决定使用中位数方法来计算基线。在我们的数据集中,
8
个特征的中
位数是如下数组:
[151.0, 93.5, 2803.5, 15.5, 76.0, 1.0, 0.0, 0.0]
当我们将其发送到模型时,预测的
MPG
是
22.9
。因此,对于这个模型做出的每
一个预测,我们将使用
22.9 MPG
作为基线来进行比较。
现在让我们想象一下,我们按照重构模式把它从回归问题转变成分类问题。为此,
我们为燃油效率定义“低”“中”和“高”三个桶,因此我们的模型将输出一个
3
元素的
softmax
数组,表示一辆汽车对应于每个类别的概率。采取与上面相同
的中位数基线输入,我们的分类模型现在返回以下数值作为我们的基线预测:
[0.1, 0.7, 0.2]
这样,现在每个类别都有了不同的基线预测值。假设我们为测试集的一个样本
生成一个新的预测,我们的模型输出以下数组,预测这辆车有
90%
的可能性是
“低”燃油效率的:
[0.9, 0.06, 0.04]
得到的特征归因值应该可以解释为什么模型预测了
0.9
,而对“低”类别的基线
预测值为
0.1
。我们也可以看看其他类别的特征归因值来理解,例如,为什么我 ...