Faster RCNN代码详解（四）：关于anchor的前世今生

2023-11-19

在上一篇博客中介绍了数据处理的整体结构：Faster RCNN代码详解（三）：数据处理的整体结构。这一篇博客介绍数据处理的细节——关于anchor的前世今生，代码在脚本的：~/mx-rcnn/rcnn/io/rpn.py的assign_anchor函数中。

这一部分也是你想要深入了解Faster RCNN算法细节的重要部分，因为anchor是Faster RCNN算法的核心之一。具体而言，在这篇博客中我将为你介绍：anchor是什么？怎么生成的？anchor的标签是怎么定义的？bbox（bounding box）的回归目标是怎么定义的？bbox和anchor是什么区别？

def assign_anchor(feat_shape, gt_boxes, im_info, feat_stride=16,
                  scales=(8, 16, 32), ratios=(0.5, 1, 2), allowed_border=0):
    """
    assign ground truth boxes to anchor positions
    :param feat_shape: infer output shape
    :param gt_boxes: assign ground truth
    :param im_info: filter out anchors overlapped with edges
    :param feat_stride: anchor position step
    :param scales: used to generate anchors, affects num_anchors (per location)
    :param ratios: aspect ratios of generated anchors
    :param allowed_border: filter out anchors with edge overlap > allowed_border
    :return: dict of label
    'label': of shape (batch_size, 1) <- (batch_size, num_anchors, feat_height, feat_width)
    'bbox_target': of shape (batch_size, num_anchors * 4, feat_height, feat_width)
    'bbox_inside_weight': *todo* mark the assigned anchors
    'bbox_outside_weight': used to normalize the bbox_loss, all weights sums to RPN_POSITIVE_WEIGHT
    """
    def _unmap(data, count, inds, fill=0):
        """" unmap a subset inds of data into original data of size count """
        if len(data.shape) == 1:
            ret = np.empty((count,), dtype=np.float32)
            ret.fill(fill)
            ret[inds] = data
        else:
            ret = np.empty((count,) + data.shape[1:], dtype=np.float32)
            ret.fill(fill)
            ret[inds, :] = data
        return ret

    im_info = im_info[0]
    scales = np.array(scales, dtype=np.float32)
# base_anchors是anchor的初始化结果，输入中base_size=16，表示输入图像到该层
# feature map的尺寸缩小倍数，对于resnet网络的conv4_x而言缩小倍数是16；ratios默认是[0.5,1,2]；
# scales默认是[8,16,32]。base_anchors默认是9*4的numpy array，表示9个anchor的4个坐标值，
# 4个坐标值用框的左上角坐标和右下角坐标。这9个anchor有一个共同点是中心坐标点一样，
# 这正是和RPN网络的滑窗操作对应（第一个3*3的卷积层），滑窗每滑到一个3*3区域，
# 则以该区域中心点为坐标就会生成9个anchor。
    base_anchors = generate_anchors(base_size=feat_stride, ratios=list(ratios), scales=scales)
    num_anchors = base_anchors.shape[0]
# feat_height和feat_width表示该层feature map的size，比如对于resnet的res4而言，
# 缩放系数是16，所以如果输入图像是600*900，则feat_height=600/16，feat_width=900/16
    feat_height, feat_width = feat_shape[-2:]

    logger.debug('anchors: %s' % base_anchors)
    logger.debug('anchor shapes: %s' % np.hstack((base_anchors[:, 2::4] - base_anchors[:, 0::4],
                                                 base_anchors[:, 3::

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

计算机视觉

目标检测object detection

mxnet

Faster RCNN代码详解（四）：关于anchor的前世今生的相关文章

「2020年大学生电子设计竞赛分享」电源题，省一等奖！

点击上方大鱼机器人选择置顶星标公众号福利干货第一时间送达 01 到底参不参赛嗡嗡嗡随着手机的一声振动锁屏弹出了消息提醒没看全文依稀瞄到2020 TI杯几个字眼我便知道自己将面临一个艰难的抉择庚子年春突如其来的新型
芜湖，前端这波起飞！

前天加完班回家路上翻了下粉丝群发现群里最近在疯传一份叫前端offer收割机养成指南的资料本来感觉这个title看起来有点离谱结果没想到仔细一看这份资料竟然真的有点东西内容收纳的很全而且融合了很多今年的新玩意据我所知有人靠
BSD、Apache、MIT、GPL、LGPL几种常见的开源协议

转载地址 https www cnblogs com Vito2008 p 4806677 html 1 BSD开源协议 original BSD license FreeBSD license Original BSD license B
u盘安装ubuntu问题：卡在引导界面不动

问题一直卡在如图界面不动分析既然一直提示syslinux 那我们就看看他是什么东西吧原因 syslinux分区引导记录问题解决方案1 安装bootice软件将制作好的启动盘插入电脑用bootice更改syslinux引导记录
8.10:如何在Python中判断文件类型？

在计算机科学领域中文件类型判断是一个非常基础和重要的问题不同类型的文件需要采取不同的处理方式因此在处理文件时我们需要准确地判断文件类型 Python作为一门流行的编程语言提供了许多方法来判断文件类型在本文中我们将介绍几种常见的

随机推荐

@vitejsplugin-vue requires vue (＞=3.2.13) or @vuecompiler-sfc to be present in the dependency tree

运行项目的时候首先会提示要安装 vue compiler sfc 但是安装后运行项目成功但是页面是空白并且报错 VUE HMR RUNTIME is not defined 摸索了半天查看到package json依赖文件没有vue
RTX线程通信之——线程标志

文章目录 Thread Flags 概念 RTX线程标志API 案例 LED灯同步闪亮小结参考资料 Thread Flags In a real application we need to be able to communicate
mbedtls 入门第四课--移植mbedtls到VS和ESP8266--8266SDK SHA256移植

承接上篇我们初步了解了mbedtls的文件路径以及文件作用以后就是想着如何将mbedtls移植到各种平台博主这里只有两种移植方法第一是将代码移植到VS中第二个是将代码移植到博主跑动的比较多的小众SOC ESP8266 移植到ESP8
【华为OD机试】五子棋迷(C++ Python Java)2023 B卷

时间限制 C C 1秒其他语言 2秒空间限制 C C 262144K 其他语言524288K 64bit IO Format lld 题目描述张兵和王武是五子棋迷工作之余经常切磋棋艺这不这会儿又下起来了走了一会儿轮张兵了对
技术积累 — Keil 查看内存占用/优化代码

原文链接转自Sugar的专栏转载文章若有不妥通知后我会立即删除一查看内存占用 1 使用Keil编辑代码时编译成功后双击红色框框位置就会弹出 map文件 2 那么map文件中能够读出哪些信息呢 Program Size Co
caffe中lstm的实现以及lstmlayer的理解

本文地址 http blog csdn net mounty fsc article details 53114698 本文内容本文描述了Caffe中实现LSTM网络的思路以及LSTM网络层的接口使用方法本文描述了论文 Long ter
自学软件测试需要多久?怎么自学软件测试?自学软件测试可以找到工作吗? 绝对干货！

一前言最近经常有很多朋友问我想要入行软件测试但是都不知道该怎么学这里详细的给大家说下对于0基础的朋友应该怎么去学习软件测试学习软件测试有2条路可以选 1 找个靠谱的培训机构去培训啦你就什么都不用想了跟着培训结构认真的学习就
Hive Sql执行出错 Dag submit failed due to java.io.IOException: All datanodes DatanodeInfoWithStorage

原因根本原因是集群中的一个或多个信息块在所有节点中都已损坏因此映射无法获取数据命令 hdfs fsck list corruptfileblocks 可用于识别集群中损坏的块当数据节点中打开的文件数量较少时也会出现此问题解决方案
微信小程序传递数组给服务器,微信小程序页面间的数组如何传递

A页面数组对象都需要stringify var listData JSON stringify that data listData var taskArray JSON stringify that data taskArray wx
visual studio2019(C#/.NET)安装教程

前言好久没有跟新版本了博主还用的2017 看到最新的2019功能还是很强大的版本可能越高越好所以博主写了一个详细的博客希望可以帮助到大家一 visual studio 2019 下载 1 下载地址 visual studio官方
爬取药品监督情况数据

首先打开国家药品监督局的相应网址国家药品监督局的相应网址找到某一家企业点击相应的许可证编号那一个栏目查看相应的许可证情况上面对应的内容为我们需要爬取的对应的数据不确定对上述的网页进行访问的时候我们能够得到对应的企业名称许可证编
apollo5.5感知模块改进

apollo5 5感知模块改进最近一直在研究百度的apollo源码感知部分下面整理一下近期的一些知识点 apollo5 5在感知部分做了些升级以适应最新的apollo自动驾驶套件主要的特征及改进 1 全新的数据Pipline服务以及
射发射整改案例

文章摘录 http www elecfans com emc emi 1244893 html 试验现象系统在300K 200MHz辐射发射超标 2 诊断过程 1 使用近场探头置于模块显示屏时 1MHz以下频段超标则低频电磁干扰来源于显
pandas 行、列的增删改查

读取tips xlsx及预览内容行的增删改查增加行直接赋值可以只写一个值也可以写列表 df loc 40 1 df loc 40 1 2 3 4 5 6 7 append方法 append 增加行的方法设置ignore inde
数据结构--图的遍历（广度优先遍历、深度优先遍历）

目录图的遍历广度优先遍历 BFS 广度优先遍历的代码实现编辑广度优先遍历序列编辑遍历序列的可变性编辑 BFS算法完整版编辑广度优先遍历复杂度分析广度优先生成树广度优先生成森林回顾广度优先遍历深度优先遍历 DFS 回
Opencv项目实战：00 专栏内容介绍

目录 Opencv项目实战专栏介绍 01 文字检测OCR 02 角度探测器 03 扫描二维码条形码 04 全景图片拼接 05 物体检测 06 文档扫描仪 07 人脸识别和考勤系统 08 Yolov3更高精度的检测物体 09 物体尺寸测量
react-dnd 拖拽能力教程

前言近几年来低代码零代码的热度在国内逐年递增复杂度同力一样不会消失也不会凭空产生它总是从一个物体转移到另一个物体或一种形式转为另一种形式用户在使用低零代码构建应用程序时这些能力只是被平台研发人员提前编写完了作为低零代码的基
Spark 任务调度机制

1 Spark任务提交流程 Spark YARN Cluster模式下的任务提交流程如下图所示图YARN Cluster任务提交流程下面的时序图清晰地说明了一个Spark应用程序从提交到运行的完整流程图Spark任务提交时序图提交
不要一上来就学框架

问有两年多前端经验但感觉自己对后端知之甚少没有安全感但是后端语言又多不知道学哪一门性价比好一些求教语言不是重点尤其是你已经会一门语言的情况下后端编程最最基本的技术是这些 1 浏览器和服务器是怎么打交道的重点就是HTTP协
Faster RCNN代码详解（四）：关于anchor的前世今生

在上一篇博客中介绍了数据处理的整体结构 Faster RCNN代码详解三数据处理的整体结构这一篇博客介绍数据处理的细节关于anchor的前世今生代码在脚本的 mx rcnn rcnn io rpn py的assign anchor

Faster RCNN代码详解（四）：关于anchor的前世今生

Faster RCNN代码详解（四）：关于anchor的前世今生 的相关文章

随机推荐

热门标签

Faster RCNN代码详解（四）：关于anchor的前世今生的相关文章