1 网络结构
- 首先输入图像,进行尺度裁剪成固定的M*N,如果比例不匹配可以先填充再裁剪
- backbone进行特征提取,常见的有VGG16、Resnet 50等
- 对特征图进行特征提取,进入RPN,RPN中有两个分支,上面一部分用于判断有无目标,下面一部分负责对候选框的位置进行调整
- Roi Pooling层则利用RPN生成的proposals从feature maps中提取特征proposal features
- 最后送入FC全连接层和softmax网络完成检测任务
2 锚框生成
锚点由图像经过特征提取后的维度所组成,每个锚点有9个先验框,每个框包含左上和右下角的坐标
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)