I'v been trying to do quadrangle detection and localization for weeks, my goal is to have a robust way of getting the 4 points of an quadrangle(rectangle), so I can apply projective transform to an Image then attach it to the source image. I have try the classic opencv contour method, and also using hough transform to find lines then calculate intersections, those two methods is unusable when apply it to real life images.
所以我向CNN寻求帮助,但目前我还没有找到任何人尝试使用CNN来解决这个简单的问题。
我的第一次尝试是使用最先进的对象检测和定位方法来获取四边形的边界框,这样我就可以缩小 4 个点的搜索范围,然后使用图像处理和计算机视觉方法进一步搜索 4 个点。但尝试YOLOv2和Faster-RCNN后,预测精度并不理想。
所以我想知道是否有任何想法可以使用单个神经网络进行端到端的训练和前馈。它还必须能够很好地处理遮挡问题。
目前我的想法是删除 fc 层并制作一个与第一个输入层具有相同宽度和高度的巨大激活图(例如 448x448),然后优化 4 个最高度激活的区域,使用 argmax 来获取位置。但这种方法仅适用于一个四边形,对于角遮挡也效果不佳。
如果有人能提供任何建议,我将不胜感激。多谢!
您提到的第一种方法是完全正确的。霍夫变换之类的方法很旧,对于野外图像没有用处。当然,随着深度学习的兴起,计算机视觉领域转向了目标检测和识别。
然而,最近出现了一个非常好的讨论。我们是否忘记了计算机视觉中的几何? http://alexgkendall.com/computer_vision/have_we_forgotten_about_geometry_in_computer_vision/
我的建议是轮廓检测,然后应用霍夫变换(使用最先进的)方法来检测您想要的矩形,关于遮挡,您可以设置霍夫变换的参数,以便对带有参数的丢失边缘像素更加宽容。
例如,您可以检查最新的轮廓检测方法,如最近的CVPR论文 http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shen_DeepContour_A_Deep_2015_CVPR_paper.pdf.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)