众所周知,用于目标检测的 nVidia DetectNet - CNN(卷积神经网络)基于 Yolo/DenseBox 的方法:https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/ https://devblogs.nvidia.com/parallelforall/deep-learning-object-detection-digits/
DetectNet 是流行的 GoogLeNet 网络的扩展。这
扩展与中采用的方法类似Yolo 和 DenseBox文件。
如图所示,DetectNet 可以检测任意旋转的物体(汽车):https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/ https://devblogs.nvidia.com/parallelforall/detectnet-deep-neural-network-object-detection-digits/
现代 CNN(卷积神经网络)作为 DetectNet 旋转不变吗?
我可以在具有相同物体旋转角度的数千张不同图像上训练 DetectNet,以检测任何旋转角度的物体吗?
那么基于 DetectNet 的 Yolo、Yolo v2、DenseBox 的旋转不变式又如何呢?
No
在分类问题中,CNN 不是旋转不变的。您需要在训练集中包含每一次可能的旋转图像。
您可以训练 CNN 将图像分类为预定义的类别(如果您想像示例中那样检测图像中的多个对象,则需要使用分类器扫描图像的每个位置)。
然而,这是一个对象检测问题,而不仅仅是一个分类问题。
在目标检测问题中,可以使用滑动窗口方法,但效率极低。相反,简单的 CNN 其他架构都是最先进的。例如:
- 更快的 RCNN:https://arxiv.org/pdf/1506.01497.pdf https://arxiv.org/pdf/1506.01497.pdf
- 优乐网:https://pjreddie.com/darknet/yolo/ https://pjreddie.com/darknet/yolo/
- SSD: https://arxiv.org/pdf/1512.02325.pdf https://arxiv.org/pdf/1512.02325.pdf
这些架构可以检测图像中任何位置的对象,但您还必须在训练集中包含具有不同旋转的样本(并且训练集必须使用边界框进行标记,这非常耗时)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)