【pytorch目标检测】开山之作:R-CNN算法解读

2023-11-08

背景

  • 将“深度学习”和传统的“计算机视觉”的知识相结合,没有过多的使用深度学习
  • 2014年将PASCALVOC数据集检测率从35%提升到53%

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uvig15aQ-1650618571353)(../../../%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B/two-stage/Faster-RCNN/Faster-RCNN.assets/1650615463343.png)]
在这里插入图片描述

具体步骤


总体的步骤图

在这里插入图片描述

1.候选区域生成:ROI(Regions of Interst)

  1. Selective Search算法
  2. 将图像分割承小区域,合并包含同一物体可能性较高的区域,提取约2000个候选区域
  3. 归一化处理,得到固定大小的图像

利用 Selective Search 算法通过图像分割的方法得到一些原始区域,然后利用一些合并策略将这些区域合并,得到一些层次化的区域结构,而这些结构就包含着可能需要的物体。这里的 SS 算法可以详见 此处,算法原始论文Selective Search for Object Recognition。(初始区域的获取是引用另一篇论文的:Efficient Graph-Based Image Segmentation)
在这里插入图片描述

在这里插入图片描述

2.CNN提取

将固定大小的图像,利用AlexNet CNN网络得到固定维度的特征输出

3.SVM分类器

  • 线性二分类器对输出特征进行分类
  • 得到是否属于此类的结果,采用难样本挖掘来平衡正负样本的不平衡

在这里插入图片描述

在这里插入图片描述

对2000x20的每一列近NMS处理

在这里插入图片描述

4.位置精修

通过回归器对特征边界回归=Bounding Box regression从而得到更为精准的目标区域
在这里插入图片描述

存在的问题

  • 候选区域需要提前提取并保存,占用空间较大
  • 涉及分类中的全连接网络,所以尺寸是固定的,精度会低
  • 需要多步训练,步骤繁琐且训练速度慢

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eELStFIv-1650618571358)(../../../../../../windows/system32)]

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【pytorch目标检测】开山之作:R-CNN算法解读 的相关文章

随机推荐

  • python脚本实现sql时间盲注

    这里用sqli labs master第10关举例 1 爆数据库长度 coding utf 8 import requests import datetime import time 获取数据库名长度 def database len fo
  • 超实用的 linux atop 与 htop 监控工具讲解与实战操作

    文章目录 一 概述 1 atop 概 2 htop 概述 二 top atop 和 htop 对比 1 top 2 atop 3 htop 三 atop 与 htop 监控工具安装 四 atop 与 htop 命令的基本语法 1 atop
  • Tcl-5. format 命令

    format 命令和 C 语言中的 printf 和 sprintf 命令类似 它根据一组格式说明来格式化字符 串 此命令不会改变被操作字符串的内容 语法 format spec value1 value2 spec 变元包含了格式说明关键
  • VCPKG

    VCPKG C C dependency manager from Microsoft For all platforms buildsystems and workflows
  • java高级编程

    java高级编程 目录 java高级编程 一 多线程 1 程序 进程 线程的理解 1 1程序 1 2进程 1 3线程 补充 内存结构 2 并行与并发 3 线程的创建和使用 3 1多线程的创建方法一 继承于Thread 类 3 2多线程的创建
  • 一文看懂卷积运算(convolution)与互相关运算(cross-correlation)的区别

    目录 互相关运算定义 互相关运算图示 互相关运算完整计算示例 卷积数学定义 卷积运算图示 卷积与互相关运算区别 深度学习中的卷积为何能用互相关运算代替 互相关运算定义 在二维互相关运算中 卷积窗口从输入数组的最左上方开始 按从左往右 从上往
  • JDK动态代理对象与被代理对象地址值问题

    JDK动态代理对象与被代理对象地址值问题 1 UserService接口 2 UserServiceImpl接口实现类 3 ProxyFactoryByJDK代理工厂类 4 UserTest测试类 5 结果 问题 打印userService
  • 3-python包和模块-分类

    标准包 模块 第三方包 模块 自定义包 模块 什么是标准模块 安装pyhton后 电脑上面就存在的一些模块 可以直接导入使用 os sys time 每个安装了python的用户电脑上都有这些模块 在一台电脑上面使用了系统模块的代码 到另外
  • DataBinding表达式使用bug:databinding javax.xml.bind.UnmarshalException

    问题描述 使用DataBinding时 在XML文件中使用带有中文字符的表达式时 程序编译报错 Exception while handling step android databinding annotationprocessor Pr
  • 快速排序—C语言实现

    目录 前言 快速排序 实现逻辑 1 hoare版本 编辑 2 挖坑法 3 前后指针版本 快速排序优化 1 三数取中法选key 2 递归到小的子区间时 可以考虑使用插入排序 快速排序非递归 用栈实现 快速排序的特性总结 全部代码 前言 在学数
  • Flutter--macos环境配置

    Flutter macOS环境配置 1 安装 去flutter官网下载安装包 解压到你想安装的目录 2 配置环境变量 命令行open bash profile打开配置文件 添加 在打开的页面添加上下面代码 export PATH 自己flu
  • 关于RestTemplate使用过程中的两个问题(请求的URL中带有%25,转换的对象属性值与相应的json串中的key值不对应转换失败)

    问题一 请求的URL中带有 25 解决 如果请求的URL中包含 号 尤其是参数经过URLEncode之后 restTemplate会把 转成 25 因此将请求地址封装成URI对象既可 例如 User user restTemplate po
  • 内核中的位图介绍(DECLARE_BITMAP宏)

    1 DECLARE BITMAP宏定义 define DIV ROUND UP x y x y 1 y 向上取整 define BITS TO LONGS nr DIV ROUND UP nr BITS PER BYTE sizeof lo
  • 影响中国软件人物之:倪光南院士

    一 个人简况 倪光南 1939年8月1日出生于浙江宁波 1994年被遴选为中国工程院首批院士 曾担任中科院计算所研究员 联想集团总工程师 二 重要成果 1 1964年 参与吴几康主持研制的119机研制项目成功 2 1974年 作为计算所代表
  • vue-cli 安装 报错 no such file or directory , access.问题解决。

    解决发案 第一步 查看默认全局安装路径 指令 npm config get prefix 复制默认全局安装路径在你的系统显示目录中删除npm文件夹 对于大多数系统显示目录为 usr local 第二步 cmd进入到你的项目路径初始化npm就
  • Java基础 -- 多线程的使用01

    Java基础 多线程的使用 1 关键字 1 1 并发与并行 1 2 进程和线程 2 Java 线程 2 1 Java的主线程 2 2 线程生命周期 3 Java 线程三种实现 3 1 继承Thread类 3 2 实现Runnable接口 3
  • python 语言 实现一个WEB登陆应用程序

    实现一个 Python 语言的 WEB 登录应用程序需要掌握一些基础知识 例如 HTTP 协议 网络编程 加密算法等 以下是一个基本的框架 供参考 熟悉 HTTP 协议和 Web 服务器与客户端的基本通信机制 使用 Python 的网络编程
  • 使用Python将pyd文件打包成安装包whl

    先说效果 可以将一个或多个py文件编译为源码不可见的 pyd文件 同时将pyd文件打包为whl文件 他人使用时 只需要将whl文件发送过去 对方通过安装whl文件 就可以将你写的代码文件 库文件 安装到python环境了 首先将py代码文件
  • 前后端分离技术逐步深入,让你更加深入理解Nginx+Tomcat

    你提到了熟悉Tomcat和Nginx服务器的配置 以及应用前后端分离技术 请解释一下Tomcat和Nginx的主要作用是什么 以及在前后端分离中它们的角色是什么 标准回答 Tomcat是一个Java应用服务器 主要用于运行Java Web应
  • 【pytorch目标检测】开山之作:R-CNN算法解读

    背景 将 深度学习 和传统的 计算机视觉 的知识相结合 没有过多的使用深度学习 2014年将PASCALVOC数据集检测率从35 提升到53 具体步骤 总体的步骤图 1 候选区域生成 ROI Regions of Interst Selec