【目标检测】各种方法中比较难理解的地方

2023-11-13

1.评价指标mAP

全网最清楚的解释!!!,强推~!
原文链接:http://blog.sina.com.cn/s/blog_9db078090102whzw.html
理解的关键点在于每一次的precision和recall计算都是在top_X的基础上计算的!!一定要先搞清楚在目标识别中由于经常都是取top_N(N一般为5)进行输出的,所以precision和recall的定义与二分类时是不相同的!!!
这里写图片描述

2.YOLO中confidence的理解

参考博客:CNN目标检测与分割(二)YOLO: http://www.360doc.com/content/17/1013/16/42392246_694639199.shtml
这里写图片描述
理解的关键点在于
confidence的计算表达了这个框中存在object的置信度并且乘上IOU,表达了边界框(x,y,w,h)预测的准确度
后面针对于特定类的confidence(也就是每个框每个anchor最后输出的结果中代表类别的那C个位置上的值)的计算只需要用P(Classi|Object)*confidence
这是因为在训练时我们有Ground Truth,可以训练confidence,于是在测试时我们没有Ground Truth,但是我们有预测出来的confidence,于是还是可以预测针对于特定类的confidence,从而给出最终结果
所以confidence必须存在于标签中,而且confidence低的点也就相当于被分类了其他类/背景

另一个需要解释的地方是,YOLO在进行类比诶预测时十分简单粗暴,从每个网格的输出大小为(5×B+C)可以看出,对于每一个网格,YOLO忽略了5个bounding boxes每个网格只判断了一次类别,所以不是B×(5+C)
【为什么可以如此简单粗暴呢?因为对每一个类别分别进行了NMS,而相同类别的物体如果重合率很高也没必要非要区分出来是两个物体吧】

所以可以断定Pr(Class_i|Object)的为维度为C*B
confidence = Pr(object) · IOU 的维度为B*1
最后输出类别的维度为C×1,是B个bounding boxes综合后的结果

3.1*1卷积网络的妙用,为什么说用卷积可以减少滑动窗口的重复计算

图片来源于吴恩达deeplearning.ai
很神奇吧,卷积到最后剩下的n×n结果,就是n*n个滑动窗口的结果!!!!而不需要在一开始的时候分别将图片的每一个窗口滑动过的部分分别输入卷积网络,从而减少了大量的重复计算。

4.IOU && NMS

这里写图片描述
yolo中对于所有的s*s个各自产生的结果,先利用confidence(也就是预测出来的Pr(Object)*IOU<=0.6)抛弃一部分格子,再利用nms,将最终的C_confidence最大的格子与其他格子做IOU,并抛弃掉IOU>0.5的格子。
通过这两步,应该就可以得出最终的目标识别结果了

对于多分类问题,需要对于每一类单独进行NMS!!!!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【目标检测】各种方法中比较难理解的地方 的相关文章

随机推荐

  • VirtualBox下设置共享文件夹并自动挂载

    想在主机和VirtualBox的Ubuntu建个共享文件夹 之前一直没搞定 今晚却特别的顺利 以下是设置的步骤 1 安装VirtualBox的VBoxGuestAddition iso 在 设备 gt 安装增强功能 安装结束记得重启 以前在
  • golang实现cron定时任务

    golang实现cron定时任务 在编写爬虫的时候 需要定时抓取实时的新闻资讯 原来采用的linux的crontab 但是发现并不是很灵活 而且不能定制 所以就采用golang写了一套 发现网上的文章 有很多坑 所以整理了一套代码 下载包
  • 前端-vue中的cron表达式插件

    vue中的cron表达式插件 样例 安装 引入 参数 联系方式 git地址 https gitee com CzRger CzrVueCron 样例 安装 可通过npm的方式进行安装 npm install czr vue cron 引入
  • GDAL教程——Geotransform

    教程参考链接 非常好的学习资料 https gdal org tutorials geotransforms tut html 1 geotransform 函数 地理变换函数 地理变换是从图像坐标空间 行 列 也称为 像素 线 到地理引用
  • CSPP 数据的机器级表示

    寄存器 intel x86 64 调用寄存器与被调用寄存器 因为要保证在调用函数返回后寄存器的值恢复为未被调用之前 所以下面的例子运用pushq指令保存被调用寄存器rbx的值 函数 gcc产生的指令指示操作数的大小 寄存器的作用 rax存储
  • 华为OD机试 - 勾股数元组(Java)

    题目描述 如果3个正整数 a b c 满足a 2 b 2 c 2的关系 则称 a b c 为勾股数 著名的勾三股四弦五 为了探索勾股数的规律 我们定义如果勾股数 a b c 之间两两互质 即a与b a与c b与c之间均互质 没有公约数 则其
  • Torch安装

    安装步骤参考官网http torch ch docs getting started html 安装过程中可能遇见的问题 1 执行命令 git clone https github com torch distro git torch re
  • python后端学习(九)GIL、深/浅拷贝、私有化、import、封装继承多态

    GIL面试题 描述Python GIL的概念 以及它对python多线程的影响 编写一个多线程抓取网页的程序 并阐明多线程抓取程序是否可比单线程性能有提升 并解释原因 Guido的声明 http www artima com forums
  • Android微信页面缓存清理,安卓用户如何彻底清理微信大量缓存?4招让你彻底解决内存烦恼...

    原标题 安卓用户如何彻底清理微信大量缓存 4招让你彻底解决内存烦恼 作为一个64G版的安卓用户 现在隔三差五就要对手机的内存进行清理 更不用说还在用16G的你了 如果经常出现手机的提醒你的存储容量几乎已满时 你是不老是跟小编以前一样去相册里
  • (Java) 算法题:2的N次方

    题目描述 原题链接 2的N次方 对于一个整数N 512 lt N lt 1024 计算2的N次方并在屏幕显示十进制结果 输入描述 输入一个整数N 512 lt N lt 1024 输出描述 2的N次方的十进制结果 输入例子1 512 输出例
  • 实现即时通讯的几种方式

    文章目录 1 短轮询 2 长轮询 3 SSE 4 WebSocket 总结 在 Web 应用程序中 实现即时通讯是一件常见的任务 为了实现即时通讯 我们需要使用一些特殊的技术和协议来建立一个实时连接 以便实时更新数据 在本文中 我们将介绍几
  • 本地编辑shopify主题的第一种方式

    先进入Shopify商店后台 新建应用程序 填写完无关紧要的信息后 把Theme templates and theme assets权限设置为读写访问权限并保存 然后复制密码 这表示可以通过这个密码对主题进行读写修改了 然后按照命令获取主
  • k8s-(五)最全的安装教程(使用kubeadm在Centos7上部署kubernetes1.18)以及安装异常问题记录

    k8s使用kubeadm进行安装步骤 使用kubeadm安装k8s会简单很多 一直想总结写一篇简单明了的安装教程 希望能有用 k8s在2020年初发布的第一个版本是1 18 0 目前最新版本是1 19 4 并且1 20的版本应该会在年底发布
  • Oracle PL/SQL中的循环处理(sql for循环)

    今年春节算是休了个长假 调整好心态 迎接新一年的挑战 今天来说下Oracle中的循环迭代处理 因为从自己的博客统计中看到 不少网友都搜索了关键字 SQL FOR循环 所以打算在这里说下个人的理解 PL SQL也和我们常用的编程语言一样 提供
  • 真香!用python做副业,月赚1W+,别被死工资拖累

    被压垮的打工人 你还好吗 房贷车贷 上老下小 日常开销 但你的收入有多少 所以你不敢生病 甚至不敢回家 就为了每个月那么点死工资 还得天天加班 然而忙忙忙 却变成了 穷忙族 成为了职场废人 其实很多人都想改变现状 想学点什么的 但就是不知从
  • c语言 字母消消乐,消消乐(C语言版)

    消消乐 游戏规则很简单 点击的位置颜色相连的区域抵消 实现思路 从点击位置开始深搜 递归 记录搜索的坐标并抵消 贴上关键代码 map数组保存每个点的颜色 state保存是否搜索过 判断当前点是否满足条件 并且未搜索过 int isValid
  • VS Code 快捷键(中英文对照版)

    标签 空格分隔 visual studio code 常用 General 按 Press 功能 Function Ctrl Shift P F1 显示命令面板 Show Command Palette Ctrl P 快速打开 Quick
  • 快速解决QQ自动下载腾讯视频播放器

    使用电脑QQ播放视频时 QQ总是会使用默认安装的腾讯视频播放器打开 可是他的这个播放器非常的卡 自己设置的默认不使用播放仍然不起作用 用geek观察了一下电脑 确实没发现腾讯视频 于是在播放视频的时候打开任务管理器 终于发现了腾讯视频播放器
  • 原理图以及vhdl设计一位全加器

    原理图设计以及VHDL设计 一位加法器 全加器原理 全加器真值 输出表达式 原理图设计法 VHDL设计法 代码如下 全加器是用门电路实现两个二进制数相加并求出和的组合线路 称为一位全加器 一位全加器可以处理低位进位 并输出本位加法进位 多个
  • 【目标检测】各种方法中比较难理解的地方

    1 评价指标mAP 全网最清楚的解释 强推 原文链接 http blog sina com cn s blog 9db078090102whzw html 理解的关键点在于每一次的precision和recall计算都是在top X的基础上