经过几个小时的研究,我找不到任何使用对象检测 API 进行多标签预测的示例。基本上我想预测图像中每个实例的多个标签。如下图所示:
我想预测服装类别,还有颜色和图案等属性。
根据我的理解,我需要将每个属性的更多分类头附加到第二阶段 ROI 特征图,并对每个属性的损失求和?但是,我在对象检测代码中实现此功能时遇到困难。有人可以给我一些关于我应该开始修改哪些功能的提示吗?谢谢。
根据性能要求和平台,一种方法可能是通过在管道中使用多个分类器来简化问题。例如,您可以使用多类对象检测器(示例中的“tee”和“pant”)来捕获感兴趣的区域;然后根据边界框裁剪这些区域,并将这些裁剪区域输入到另一个模型中,在这种情况下,该模型没有局部性要求(“颜色”和“图案”)。
对于多类对象检测指南,我可能会推荐Eager Few Shot 物体检测 Colab来自Tensorflow Git 存储库。在里面 '准备训练数据' 单元格注释:
num_classes = 1
category_index = {duck_class_id: {'id': duck_class_id, 'name': 'rubber_ducky'}}
更新它可以在不改变模型的情况下实现多类检测。例如,以下将创建两个类:
num_classes = 2
category_index = {
1: {'id': 1,
'name': 'tee'},
2: {'id': 2,
'name': 'pant'}
}
然后根据此输出,将这些裁剪区域输入到另一个分类器中。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)