centernet(cornernet)中通过高斯核函数画热点图时高斯半径的确定及改进成椭圆高斯图

2023-10-31

为什么采用二维的高斯核

参考https://zhuanlan.zhihu.com/p/96856635（其中原因解释合理，但公式推导有待商榷）

在设置GT box的heat map的时候，我们不能仅仅只在top-left/bottom-right的位置设置标签（置为1），因为你看下图，其中红色的bbox为GT框，但是绿色的框其实也能很好的包围目标。所以如果在检测中得到想绿色的这样的框的话，我们也给它保留下来。甚至说的更普遍一些，只要预测的corners在top-left/bottom-right点的某一个半径r内，并且其与GTbox的IOU大于一个阈值(一般设为0.7)，我们将将这些点的标签不直接置为0，那置为多少呢？可以通过一个温和的方式来慢慢过渡，所以采用二维的高斯核未尝不可。（对于centernet一样）

那问题现在就变成了如何确定半径r，使得IOU与GT box大于0.7的预测框不被直接阉割掉。
在这里插入图片描述

椭圆高斯半径公式推导

注：
1 下面贴出的是改进的确定高斯半径的公式。先是推导出圆形高斯图的半径，再利用最小的圆形高斯图的半径推导出椭圆高斯图的半长轴和半短轴；
2 对于上面参考链接中推导的公式（也是官方代码中的公式）为什么有待商榷，下面参考链接前面部分进行了解释。

参考https://github.com/princeton-vl/CornerNet/issues/110
在这里插入图片描述

用这里确定的r2来画高斯图，结果是个圆形，对于长宽相似的可以，但对于长宽差距较大的（如下图），就不合适。因为，对于边界框是下面形状的目标，显然在满足IOU=0.7的条件下，中心点沿长边可取的范围比沿短边可取的范围要大的多。
在这里插入图片描述
所以，高斯图应该是个椭圆（oval），一个轴（指椭圆长轴或短轴）控制关键点在一个方向上（边界框长边方向或短边方向）的移动；
由上面已推断出，选高斯半径r2，则椭圆的两个轴都按r2算

上图中，对于a、b两轴都有，σa =a/3 , σb = b/3是因为(μ−3σ,μ+3σ)范围的面积占高斯曲线下总面积占99.7%，一般3σ外的数值已接近于0，可忽略，所以一般取半径为3σ，所以知道半径，即可退出σ。
参考https://www.cnblogs.com/shine-lee/p/9671253.html

确定椭圆高斯图具体步骤
(1)get r , r = min(r1、r2、r3)
(2)get a and b
(3)change the gasssian function , 代码如下
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

论文解读

深度学习

视觉

centernet(cornernet)中通过高斯核函数画热点图时高斯半径的确定及改进成椭圆高斯图的相关文章

数组中常用的方法

一 push 方法和 pop 方法 push 方法用于向数组末尾添加一个或多个元素并返回修改后的数组的新长度 const fruits 苹果香蕉 const res fruits push 橘子西瓜 console log fruit
Vue + Element UI+Scss + Vuex一键换肤 , 一键换字体大小 ,动态替换全局主题颜色

一前言其实我这个写法每个UI库都通用不局限于ElementUI 看明白思路就知道怎么写了一键换肤动态替换全局主题颜色功能已经实现很久了在项目验收的时候出现了一个小问题想改动一下于是来记录一下前段时间公司项目里需要实现一键换
get 和 post 的区别

使用场景 GET请求一般用于向服务器请求数据 POST请求一般用于向服务器提交数据请求参数的位置 GET请求通常将参数放在URL的 query 中 POST 请求通常会将数据放在请求体 body 中 GET请求通常将参数放在URL的 qu
unity 2D中，实现点击按钮可以游戏暂停的效果

在Unity 2D中可以通过以下步骤和代码来设置一个按钮实现游戏暂停的效果创建一个空对象命名为 GameManager 用于管理游戏状态在GameManager对象上添加一个脚本命名为 PauseManager 在脚本中添加以下
简述“自顶向下，逐步求精”——面向过程程序设计方法

引入所谓自顶向下逐步求精的程序设计方法网络上有着如下的说法一者是百度百科所述另一者则为维基百科的说法自顶向下设计一种逐步求精的设计程序的过程和方法对要完成的任务进行分解先对最高层次中的问题进行定义设计编程和测试而

随机推荐

C# 联合Halcon开发的完整项目案例（三套完整源码）附下载连接

C 联合Halcon开发的完整项目案例三套完整源码点我下载三套项目源码 1 C 联合Halcon开发的程序一整套源码相机点胶定位图像采集数据查询相机间通讯具体情况如下图所示案例注释详细方便二次开发 2 C Halcon Vi
从零开发校园商铺平台（SSM到SpringBoot）一.开发准备，实体类设计与表创建

依山傍水房树间行也安然住也安然一条耕牛半顷田收也凭天荒也凭天雨过天晴驾小船鱼在一边酒在一边夜晚妻子话灯前今也谈谈古也谈谈日上三竿犹在眠不是神仙胜似神仙一开发准备创建maven项目解决项目报错新增pom
Chrome插件(扩展)开发全攻略

目录写在前面仓库说明前言什么是Chrome插件学习Chrome插件开发有什么意义为什么是Chrome插件而不是Firefox插件开发与调试核心介绍 manifest json content scripts backgrou
qRegisterMetaType

如果要在Qt信号槽中使用自定义类型需要注意使用qRegisterMetaType对自定义类型进行注册当然在不跨线程时使用自定义类型signal slot来传递可能不会出现什么问题一旦涉及跨线程就很容易出错回想下信号槽的作用就是用来
机器学习——朴素贝叶斯分类器及sklearn实现

前言参考机器学习简单介绍朴素贝叶斯分类器机器学习专栏机器学习专栏文章目录一贝叶斯定理二贝叶斯分类法三 sklearn实现贝叶斯分类一贝叶斯定理贝叶斯定理 Bayes theorem 是概率论中的一个定理描述在已
Metasploit search参数

msfvenom 参数 q快速启动msf 不显示banner信息 x加载模块代码 p payload lt payload gt 指定需要使用的payload 攻击荷载也可以使用自定义payload 几乎是支持全平台的 l list mo
ThinkPHP3.2.3关闭调试模式及做些修改

1 首先在入口文件中关闭调试模式开启调试模式建议开发阶段开启True 部署阶段注释或者设为false define APP DEBUG false 2 修改 Conf config php 异常页面的模板文件 TMPL EXCEPTIO
Cookie与Session深入理解（一）——Cookie

基本操作 HttpServletRequest request HttpServletResponse response 1 获取cookies Cookie cookieList request getCookies 2 根据cookie
力扣312题：戳气球

力扣312题戳气球题目描述有 n 个气球编号为0 到 n 1 每个气球上都标有一个数字这些数字存在数组 nums 中现在要求你戳破所有的气球戳破第 i 个气球你可以获得 nums i 1 nums i nums i 1 枚硬
机器学习深度学习数据集大汇总

寻找一个好用的数据集需要注意一下几点数据集不混乱否则要花费大量时间来清理数据数据集不应包含太多行或列否则会难以使用数据越干净越好清理大型数据集可能非常耗时应该预设一个有趣的问题而这个问题又可以用数据来回答数据集发布平台 A
linux安装pycharm详细步骤

一用xftp远程根据把解压后的安装包文件上传到指定目录 opt module 然后 cd opt module pycharm community linux 2018 1 4 bin 执行以代码 chmod u x pycharm sh
C++小游戏---坦克大战(二)（加入传送门）--附完整代码

目录素材整理穿越草地坦克穿越草地子弹穿越草地传送门判定形式生成传送门传送坦克关卡模式效果展示总结完整代码上一篇坦克大战居然意外获得了一些关注正好最近也完善了一些功能同时也加入了一些自己想到的新元素主要是关于穿
基于Matlab实现图像去噪技术（附上完整源码+图像+程序运行说明）

图像去噪是数字图像处理中一个重要的问题它的目标是恢复由于噪声引起的图像质量下降噪声可以由各种原因引起如图像传感器的不完美性能图像传输过程中的干扰等在实际应用中图像去噪技术被广泛应用于医学图像处理计算机视觉图像识别等领域本文
vim

three basic mode of vim command mode also is default mode all the alphanumeric keys are bound to commands Typing dd will
【数据库】封锁技术

一前言数据库的并发操作通常会带来三个问题丢失更新读脏数据不可重复读解决这些问题就需要用到数据库的封锁机制进行控制但封锁机制的引入又引起了一系列问题性能下降死锁等 1 丢失更新一个事务的更新覆盖了其他事务的更新结果例如用
android小项目之新闻客户端四

基于Android小巫新闻客户端开发显示新闻详细内容UI设计 2013年2月27日天气潮湿距上一次写的主界面业务逻辑实现已经过来11天小巫觉得拖得太久了所以决定尽量把所有的内容介绍完好完成这个任务因为小巫已经开学了将会有更
利用两个小demo理解汇编代码排查内存溢出问题

利用两个小demo理解汇编代码排查内存溢出问题 https www cnblogs com liuchuanloong articles 16925695 html 背景近日处理现场问题时遇到了踩内存导致的崩溃问题然而个人对反汇编程序执
C#中的Random.Range

Random Range 0 1 包含0 不包含1
十、获取人体骨骼关键点三维坐标——Azure Kinect DK入门

Azure Kinect DK 文档 Azure Kinect Sensor SDK 文档 Azure Kinect Body Tracking SDK 文档 OpenCV文档参考文档学习边学边查资料获取人体骨骼关键点三维坐标目的
centernet(cornernet)中通过高斯核函数画热点图时高斯半径的确定及改进成椭圆高斯图

为什么采用二维的高斯核参考https zhuanlan zhihu com p 96856635 其中原因解释合理但公式推导有待商榷在设置GT box的heat map的时候我们不能仅仅只在top left bottom right

热门标签