
92
|
第
3
章
设计模式
6
:多标签
多标签设计模式指的是我们可以为一个给定训练样本分配多个标签的问题。对于神
经网络来说,这种设计需要改变模型最终输出层所使用的激活函数,同时需要我们
考虑在应用场景中如何解析模型输出。注意,这与多类别分类问题不同,在多类别
的分类任务中,一个样本被分配来自一组多个(
>1
)可能类别的某个单一标签。你
可能也听说过将多标签设计模式称为多标签、多类别分类,因为它涉及从一组多个
可能类别中选择多个标签。在讨论此模式时,我们将主要关注神经网络。
问题
通常来说,模型预测任务是将单一分类应用于一个给定的训练样本。这个预测是基
于
N
个可能的类别决定的,
N
大于
1
。在这种情况下,通常使用
softmax
作为输出层
的激活函数。使用
softmax
,我们的模型的输出是一个
N
元素数组,且该数组所有元
素的和为
1
。每一个值都表示一个特定训练样本与相应索引所对应类别相关联的概率。
例如,如果我们的模型将图像分类为猫、狗或兔子,那么给定图像的
softmax
输出可
能具有如下形式:
[.89
,
.02
,
.09]
。这意味着我们的模型预测该图像是猫的可能性
是
89%
,是狗的可能性是
2%
,是兔子的可能性是
9%
。因为在这个场景中每个图像
只有一个可能的标签,所以我们可以用
argmax
(最高概率所对应的索引)来确定我
们的模型的预测类别。不太常见的情况是,每个训练样本都可以被分配多个标签,
这就是此模式所要解决的问题。
多标签设计模式适用于基于所有数据模式训练的模型。以图像分类为例,在前面的猫、
狗、兔子的例子中,我们可以使用每个图像都描绘了多种动物的训练样本 ...