【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看)

2023-10-30

觉得有帮助请点赞关注收藏~~~

一、基于候选区域的目标检测算法

基于候选区域的深度卷积神经网络(Region-based Convolutional Neural Networks)是一种将深度卷积神经网络和区域推荐相结合的物体检测方法,也可以叫做两阶段目标检测算法。第一阶段完成区域框的推荐,第二阶段是对区域框进行目标识别。

1:Faster R-CNN目标检测算法

利用选择性搜索算法在图像中提取数千个候选区域,然后利用卷积神经网络对每个候选区域进行目标特征的提取,接着用每个候选区域提取到的特征来训练支持向量机分类器对候选区域进行分类,最后依据每个区域的分类得分使用非极大值抑制算法和线性回归算法优化出最红的目标位置。R-CNN算法的训练被分成多个阶段,包括分开训练提取特征的卷积神经网络,用于分类的分类器和分类器的训练不相关,这影响了目标检测的准确率。

Faster R-CNN方法中最重要的是使用候选区域推荐网络获得准确的候选区域框,大大加快了目标检测速度,并且将选择区域框的过程嵌入卷积神经网络中,与网络共享卷积层的参数,从而提高网络的训练和测试速度,候选区域推荐网络的核心思想是使用卷积神经网络直接产生候选区域框,使用的方法本质上就是滑动窗口。

 2:R-FCN目标检测算法

R-FCN方法的整体结构全部由卷积神经网络组成,为了给全卷积神经网络引入平移变化,用专门的卷积层构建了位置敏感分数地图,每一个空间敏感地图对感兴趣区域的相对空间位置的信息进行了编码,并插入感兴趣区域池化层来接受整合信息,用于监管这些分数地图,从而给卷积神经网络加入了平移变化。R-FCN 在与区域推荐网络共享的卷积层后面多增加了1个卷积层,最后1个卷积层的输出从整幅图像的卷积响应图像中分割出感兴趣区域的卷积响应图像,R-FCN最后1个卷积层在整幅图像上为每类生成k的平方个位置敏感分数图

 

二、基于回归的目标检测算法 

 目前在深度卷积神经网络的物体检测方面,Faster R-CNN是应用比较广泛的检测方法之一,但是由于网络结构参数的计算量大,导致其检测速度慢,从而不能达到某些应用领域对于实时检测的要求。尤其对于嵌入式系统,所需要的计算时间太长。同样,许多方法都是以牺牲检测精度为代价来换取检测速度,为了解决精度与速度并存的问题,YOLO与SSD的方法应运而生,此类方法使用基于回归方法的思想,直接在输入图像的多个位置中回归出这个位置的区域框坐标和物体类别。

1:YOLO目标检测算法

YOLO是端到端的物体检测深度卷积神经网络,与Faster R-CNN的区别在于YOLO一次性预测多个候选框,并直接在输出层回归物体位置区域和区域内物体所属类别,YOLO最大的优势就是速度快,可满足端到端训练和实时检测要求

YOLO方法的物体检测过程为:首先将输入的图像划分成7×7个小网格,在每个小网格子里预测出2个区域框,从而可在整张图像上预测2×7×7个目标物体的区域框,利用交并比衡量这些区域框与图像上的真实区域框的差距,得到可能性高的候选区域框,最后使用非极大值抑制去掉这多余的区域框,YOLO整体训练方法过程较为简单,不需要中间的推荐区域步骤,直接通过网络回归完成物体的定位与分类,但是精度较差

2:SSD目标检测算法 

SSD获取目标位置和类别的方式与YOLO方法类似,而相比与YOLO是在整张特征图上划分的7×7的网格内回归,YOLO对于目标物体的定位并不精确,所以为了解决精确问题,SSD利用类似Faster R-CNN推荐区域得分机制实现精确定位,与Faster R-CNN的推荐候选框得分机制不同,SSD在多个特征图上进行处理,SSD利用得分机制直接进行分类和区域框回归,在保证速度的同时,SSD检验结果的精度与Faster R-CNN相差不多,从而能够满足实时检测与高精度的要求

创作不易 觉得有帮助请点赞关注收藏~~~ 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看) 的相关文章

随机推荐

  • java截取字符串中的一部分字符,我先收藏为敬

    Spring框架自诞生以来一直备受开发者青睐 有人亲切的称之为 Spring 全家桶 Spring更是避免了重复造轮子的工作并跟随着互联网行业的发展做出不断的更新 很多研发人员把spring看作心目中最好的Java项目 没有之一 可以毫不夸
  • 三维气体扩散模拟matlab仿真

    目录 1 算法仿真效果 2 MATLAB源码 3 算法概述 4 部分参考文献 1 算法仿真效果 matlab2022a仿真结果如下 2 MATLAB源码 订阅用户可以获得任意一份完整代码 私信博主 留言文章链接和邮箱地址 一般第二天下午4点
  • 什么是静态变量和静态方法?如何在Java中使用它们?什么是同步和异步?如何在Java中进行同步和异步编程?什么是单元测试?如何在Java中进行单元测试?

    单元测试是一种软件测试方法 它用于测试一个软件系统的最小可测试单元 在Java中 JUnit是最常用的单元测试框架之一 它提供了一些注解和断言 可以方便地编写和运行测试用例 除了JUnit之外 Mockito也是一个非常有用的测试框架 它允
  • (转) 如何将notepad++添加到右键

    工具 原料 win 7系统 Notepad 方法 步骤 左下角点击 开始 gt 运行 gt regedit 打开注册表编辑器 在HKEY CLASSSES ROOT Shell 下 在Shell下 新建项命名为Open With Notep
  • 卧槽,做Python兼职又接了一个大单,真香

    每年的第一季度 是Python兼职接单的高潮期 近段时间 各行业对爬虫类和数分类服务的需求量呈指数级的暴增 圈子里的朋友双休都没闲着 趁着旺季接单大赚一笔 所以 最近在csdn后台咨询技术变现 兼职接单问题的朋友也越来越多 最近十天收到了六
  • 【数据库原理及应用教程(第4版

    文章目录 一 选择题 二 填空题 三 简答题 Reference 一 选择题 1 2 3 4 5 6 7 8 9 10 C B D C D B A B D B 11 12 13 14 15 16 17 18 19 20 C D A D B
  • Spring启动执行流程梳理

    注 本文梳理启动流程使用的Spring版本 4 0 2 RELEASE 使用spring配置 都需要在web xml中配置一个spring的监听器和启动参数 context param 如下
  • 基于视觉的移动平台运动目标检测

    1 声明 本文为自己的研究总结 主要根据各类文献总结而来 内容上可能有些不全面 不客观 这篇博文主要介绍的是基于视觉的移动平台运动目标检测 写这篇博文的目的主要是对自己一个阶段性总结 也希望能够帮助做这方面研究的同学 2 引言 首先 我们来
  • Nacos + Prometheus + Grafana 搭建走起~

    小伙伴们好呀 这两天在本地搭建了这个 Nacos Prometheus Grafana 主要是为了这个 nacos 填坑 然后顺便搭下这个监控中心 哈哈 文章内容比较琐碎 看完你可以了解到 怎么选择 nacos 版本 可能会踩到的坑 没错
  • 一些概念的解释

    转移支付 财政转移支付是以各级政府之间所存在的财政能力差异为基础 以实现各地公共服务水平的均等化为主旨 而实行的一种财政资金转移或财政平衡制度 用人话说 就是大家一起收税 三分留地方 七分归国家 实际上不同税种比例不同 归国家的这些国家在根
  • DELL R740服务器系统安装详细过程

    RAID配置 1 开机F2进入bios 2 选择device setting 3 Integrated Raid controller 1 xxxxxx raid 卡型号 一般是第一行 4 选择 Main Menu
  • java中上传本地图片

    如果你想上传多张图片 http blog csdn net xuanzhangran article details 54929988 如果是上传单张如下 点击上传图片按钮 上传本地 效果如图 1 原始图框 2 点击预览 弹出本地弹框 3
  • PB调用windows api删除文件夹及其子文件夹或子文件

    创建nvo folder对象 forward global type nvo folder from nonvisualobject end type type shfileopstruct from structure within nv
  • Java线程:线程的交互

    本文转载至 http lavasoft blog 51cto com 62575 99157 线程交互是比较复杂的问题 SCJP要求不很基础 给定一个场景 编写代码来恰当使用等待 通知和通知所有线程 一 线程交互的基础知识 SCJP所要求的
  • 比较流行的响应式框架

    Bootstrap Foundation Semantic UI PureCSS 与君共勉 再牛逼的梦想 也抵不住傻逼般的坚持
  • Parser-Free Virtual Try-on via Distilling Appearance Flows代码解析

    从PF AFN test开始看 先看测试代码 1 test sh python test py name demo resize or crop None batchSize 1 gpu ids 0 参数 name resize or cr
  • 子组件自定义事件,父组件调用记录-

    方式一 1 子组件 p 某个事件 p methods a b是子组件自定义的事件名 this emit b 定义传给父组件的值 2 父组件调用 父组件定义 a a methods a e console log e 定义传给父组件的值 方式
  • 华为OD机试 - 运维日志排序(Java)

    题目描述 运维工程师采集到某产品线网运行一天产生的日志n条 现需根据日志时间先后顺序对日志进行排序 日志时间格式为H M S N H表示小时 0 23 M表示分钟 0 59 S表示秒 0 59 N表示毫秒 0 999 时间可能并没有补全 也
  • utils:常见的几种日期格式和转换方法

    一 UTC格式 国际统一时间 YYYYMMDD T HHMMSS Z 或者时区标识 T表示分隔符 Z表示的是UTC 相差北京时间8小时 2020 01 13T16 00 00 000Z 对应的北京时间 2020 01 14 00 00 00
  • 【计算机视觉】目标检测中Faster R-CNN、R-FCN、YOLO、SSD等算法的讲解(图文解释 超详细必看)

    觉得有帮助请点赞关注收藏 一 基于候选区域的目标检测算法 基于候选区域的深度卷积神经网络 Region based Convolutional Neural Networks 是一种将深度卷积神经网络和区域推荐相结合的物体检测方法 也可以叫