RoI Pooling
和RoI Align
是两种常用的目标检测中的RoI
特征提取方法。它们的主要区别在于:如何将不同大小的RoI对齐到固定大小的特征图上,并在这个过程中保留更多的空间信息。
如果你是做目标检测相关的项目,那么这个问题肯定是跑不了。尤其是RCNN系列,肯定跑不掉。所以搞清楚这里的辨析,显得非常重要。
一、RoI Pooling
RoI Pooling
最早是在Fast R-CNN
中提出的,它的基本思路是:
将一个个大小不同的RoI,变成一个固定大小的网格(比如7*7),然后在每个网格上进行最大池化,输出固定大小的特征图。
RoI Pooling
实质上是什么呢?
RoI层只是SPPnets中使用的空间金字塔池化层的特殊情况,其中只有一个金字塔层。(The RoI layer is simply the special-case of the spatial pyramid pooling layer used in SPPnets in which there is only one pyramid level.)
RoI Pooling
的步骤:
- 将
bounding box
区域按输出要求的size
进行等分,很可能等分后,各顶点