centernet(cornernet)中通过高斯核函数画热点图时 高斯半径的确定及 改进成椭圆高斯图

2023-10-31

为什么采用二维的高斯核

参考https://zhuanlan.zhihu.com/p/96856635(其中原因解释合理,但公式推导有待商榷)

在设置GT box的heat map的时候,我们不能仅仅只在top-left/bottom-right的位置设置标签(置为1),因为你看下图,其中红色的bbox为GT框,但是绿色的框其实也能很好的包围目标。所以如果在检测中得到想绿色的这样的框的话,我们也给它保留下来。甚至说的更普遍一些,只要预测的corners在top-left/bottom-right点的某一个半径r内,并且其与GTbox的IOU大于一个阈值(一般设为0.7),我们将将这些点的标签不直接置为0,那置为多少呢?可以通过一个温和的方式来慢慢过渡,所以采用二维的高斯核未尝不可。(对于centernet一样)

那问题现在就变成了如何确定半径r,使得IOU与GT box大于0.7的预测框不被直接阉割掉。
在这里插入图片描述

椭圆高斯半径公式推导

注 :
1 下面贴出的是改进的确定高斯半径的公式。先是推导出圆形高斯图的半径,再利用最小的圆形高斯图的半径推导出椭圆高斯图的半长轴和半短轴;
2 对于上面参考链接中推导的公式(也是官方代码中的公式)为什么有待商榷,下面参考链接前面部分进行了解释。

参考https://github.com/princeton-vl/CornerNet/issues/110
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用这里确定的r2来画高斯图,结果是个圆形,对于长宽相似的可以,但对于长宽差距较大的(如下图),就不合适。因为,对于边界框是下面形状的目标,显然在满足IOU=0.7的条件下,中心点沿长边可取的范围比沿短边可取的范围要大的多。
在这里插入图片描述
所以,高斯图应该是个椭圆(oval),一个轴(指椭圆长轴或短轴)控制关键点在一个方向上(边界框长边方向或短边方向)的移动;
由上面已推断出,选高斯半径r2,则椭圆的两个轴都按r2算
在这里插入图片描述
在这里插入图片描述
上图中,对于a、b两轴都有,σa =a/3 , σb = b/3是因为(μ−3σ,μ+3σ)范围的面积占高斯曲线下总面积占99.7%,一般3σ外的数值已接近于0,可忽略,所以一般取半径为3σ,所以知道半径,即可退出σ。
参考https://www.cnblogs.com/shine-lee/p/9671253.html

确定椭圆高斯图具体步骤
(1)get r , r = min(r1、r2、r3)
(2)get a and b
(3)change the gasssian function , 代码如下
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

centernet(cornernet)中通过高斯核函数画热点图时 高斯半径的确定及 改进成椭圆高斯图 的相关文章

  • 数组中常用的方法

    一 push 方法和 pop 方法 push 方法用于向数组末尾添加一个或多个元素 并返回修改后的数组的新长度 const fruits 苹果 香蕉 const res fruits push 橘子 西瓜 console log fruit
  • Vue + Element UI+Scss + Vuex一键换肤 , 一键换字体大小 ,动态替换全局主题颜色

    一 前言 其实我这个写法每个UI库都通用 不局限于ElementUI 看明白思路就知道怎么写了 一键换肤 动态替换全局主题颜色功能已经实现很久了 在项目验收的时候出现了一个小问题 想改动一下 于是来记录一下 前段时间公司项目里需要实现一键换
  • get 和 post 的区别

    使用场景 GET请求一般用于向服务器请求数据 POST请求一般用于向服务器提交数据 请求参数的位置 GET请求通常将参数放在URL的 query 中 POST 请求通常会将数据放在请求体 body 中 GET请求通常将参数放在URL的 qu
  • unity 2D中,实现点击按钮可以游戏暂停的效果

    在Unity 2D中 可以通过以下步骤和代码来设置一个按钮 实现游戏暂停的效果 创建一个空对象 命名为 GameManager 用于管理游戏状态 在GameManager对象上添加一个脚本 命名为 PauseManager 在脚本中添加以下
  • 简述“自顶向下,逐步求精”——面向过程程序设计方法

    引入 所谓 自顶向下 逐步求精 的程序设计方法 网络上有着如下的说法 一者是百度百科所述 另一者则为维基百科的说法 自顶向下设计 一种逐步求精的设计程序的过程和方法 对要完成的任务进行分解 先对最高层次中的问题进行定义 设计 编程和测试 而

随机推荐

  • C# 联合Halcon开发的完整项目案例(三套完整源码)附下载连接

    C 联合Halcon开发的完整项目案例 三套完整源码 点我下载三套项目源码 1 C 联合Halcon开发的程序 一整套源码 相机点胶定位 图像采集 数据查询相机间通讯具体情况如下图所示 案例注释详细 方便二次开发 2 C Halcon Vi
  • 从零开发校园商铺平台(SSM到SpringBoot)一.开发准备,实体类设计与表创建

    依山傍水房树间 行也安然 住也安然 一条耕牛半顷田 收也凭天 荒也凭天 雨过天晴驾小船 鱼在一边 酒在一边 夜晚妻子话灯前 今也谈谈 古也谈谈 日上三竿犹在眠 不是神仙 胜似神仙 一 开发准备 创建maven项目 解决项目报错 新增pom
  • Chrome插件(扩展)开发全攻略

    目录 写在前面 仓库说明 前言 什么是Chrome插件 学习Chrome插件开发有什么意义 为什么是Chrome插件而不是Firefox插件 开发与调试 核心介绍 manifest json content scripts backgrou
  • qRegisterMetaType

    如果要在Qt信号槽中使用自定义类型 需要注意使用qRegisterMetaType对自定义类型进行注册 当然在不跨线程时使用自定义类型signal slot来传递 可能不会出现什么问题 一旦涉及跨线程就很容易出错 回想下信号槽的作用就是用来
  • 机器学习——朴素贝叶斯分类器及sklearn实现

    前言 参考 机器学习 简单介绍朴素贝叶斯分类器 机器学习专栏 机器学习专栏 文章目录 一 贝叶斯定理 二 贝叶斯分类法 三 sklearn实现贝叶斯分类 一 贝叶斯定理 贝叶斯定理 Bayes theorem 是概率论中的一个定理 描述在已
  • Metasploit search参数

    msfvenom 参数 q快速启动msf 不显示banner信息 x加载模块代码 p payload lt payload gt 指定需要使用的payload 攻击荷载 也可以使用自定义payload 几乎是支持全平台的 l list mo
  • ThinkPHP3.2.3关闭调试模式及做些修改

    1 首先在入口文件中关闭调试模式 开启调试模式 建议开发阶段开启True 部署阶段注释或者设为false define APP DEBUG false 2 修改 Conf config php 异常页面的模板文件 TMPL EXCEPTIO
  • Cookie与Session深入理解(一)——Cookie

    基本操作 HttpServletRequest request HttpServletResponse response 1 获取cookies Cookie cookieList request getCookies 2 根据cookie
  • 力扣312题:戳气球

    力扣312题 戳气球 题目描述 有 n 个气球 编号为0 到 n 1 每个气球上都标有一个数字 这些数字存在数组 nums 中 现在要求你戳破所有的气球 戳破第 i 个气球 你可以获得 nums i 1 nums i nums i 1 枚硬
  • 机器学习深度学习数据集大汇总

    寻找一个好用的数据集需要注意一下几点 数据集不混乱 否则要花费大量时间来清理数据 数据集不应包含太多行或列 否则会难以使用 数据越干净越好 清理大型数据集可能非常耗时 应该预设一个有趣的问题 而这个问题又可以用数据来回答 数据集发布平台 A
  • linux安装pycharm详细步骤

    一 用xftp远程根据把解压后的安装包文件上传到指定目录 opt module 然后 cd opt module pycharm community linux 2018 1 4 bin 执行以代码 chmod u x pycharm sh
  • C++小游戏---坦克大战(二)(加入传送门)--附完整代码

    目录 素材整理 穿越草地 坦克穿越草地 子弹穿越草地 传送门 判定形式 生成传送门 传送坦克 关卡模式 效果展示 总结 完整代码 上一篇坦克大战居然意外获得了一些关注 正好最近也完善了一些功能 同时也加入了一些自己想到的新元素 主要是关于穿
  • 基于Matlab实现图像去噪技术(附上完整源码+图像+程序运行说明)

    图像去噪是数字图像处理中一个重要的问题 它的目标是恢复由于噪声引起的图像质量下降 噪声可以由各种原因引起 如图像传感器的不完美性能 图像传输过程中的干扰等 在实际应用中 图像去噪技术被广泛应用于医学图像处理 计算机视觉 图像识别等领域 本文
  • vim

    three basic mode of vim command mode also is default mode all the alphanumeric keys are bound to commands Typing dd will
  • 【数据库】封锁技术

    一 前言 数据库的并发操作通常会带来三个问题 丢失更新 读脏数据 不可重复读 解决这些问题就需要用到数据库的封锁机制进行控制 但封锁机制的引入又引起了一系列问题 性能下降 死锁等 1 丢失更新 一个事务的更新覆盖了其他事务的更新结果 例如用
  • android小项目之新闻客户端四

    基于Android小巫新闻客户端开发 显示新闻详细内容UI设计 2013年2月27日 天气潮湿 距上一次写的主界面业务逻辑实现 已经过来11天 小巫觉得拖得太久了 所以决定尽量把所有的内容介绍完 好完成这个任务 因为小巫已经开学了 将会有更
  • 利用两个小demo理解汇编代码排查内存溢出问题

    利用两个小demo理解汇编代码排查内存溢出问题 https www cnblogs com liuchuanloong articles 16925695 html 背景 近日处理现场问题时遇到了踩内存导致的崩溃问题 然而个人对反汇编程序执
  • C#中的Random.Range

    Random Range 0 1 包含0 不包含1
  • 十、获取人体骨骼关键点三维坐标——Azure Kinect DK入门

    Azure Kinect DK 文档 Azure Kinect Sensor SDK 文档 Azure Kinect Body Tracking SDK 文档 OpenCV文档 参考文档学习 边学 边查资料 获取人体骨骼关键点三维坐标 目的
  • centernet(cornernet)中通过高斯核函数画热点图时 高斯半径的确定及 改进成椭圆高斯图

    为什么采用二维的高斯核 参考https zhuanlan zhihu com p 96856635 其中原因解释合理 但公式推导有待商榷 在设置GT box的heat map的时候 我们不能仅仅只在top left bottom right