我的问题陈述如下:
" 使用 Tensorflow 和卷积神经网络进行对象检测和定位 "
我做了什么 ?
我已经使用 tflearn 库完成了从图像中进行猫检测。我成功地使用 25000 张猫图像训练了一个模型,并且其工作良好且准确。
Current Result :
我想做什么?
如果我的图像由同一图像中的两个或两个以上对象组成,例如猫和狗在一起,那么我的结果应该是“猫和狗”,除此之外,我必须找到确切地点图像上这两个对象的(边界框)
我遇到过很多高级图书馆,比如darknet , SSD但无法理解其背后的概念。
请指导我解决问题的方法。
注意:我正在使用监督学习技术。
预期结果 :
你有几种方法可以解决这个问题。
最直接的方法是使用一些边界框建议算法(例如选择性搜索)获取一些建议的边界框,并在您已经训练的分类网络的每个建议上运行。这种方法就是R-CNN采用的方法。
对于基于上述方法的更高级算法,我建议您阅读 Fast-R-CNN 和 Faster R-CNN。
Look at 使用 R-CNN 进行物体检测? https://stackoverflow.com/questions/43402760/object-detection-with-r-cnn/43406468#43406468一些基本的解释。
暗网和 SSD 基于不同的方法,如果您想了解,可以阅读有关它们的内容
http://www.cs.unc.edu/~wliu/papers/ssd.pdf http://www.cs.unc.edu/~wliu/papers/ssd.pdf
https://pjreddie.com/media/files/papers/yolo.pdf https://pjreddie.com/media/files/papers/yolo.pdf
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)