【pytorch目标检测】开山之作：R-CNN算法解读

2023-11-08

背景

将“深度学习”和传统的“计算机视觉”的知识相结合，没有过多的使用深度学习
2014年将PASCALVOC数据集检测率从35%提升到53%

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uvig15aQ-1650618571353)(../../../%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B/two-stage/Faster-RCNN/Faster-RCNN.assets/1650615463343.png)]
在这里插入图片描述

具体步骤

总体的步骤图：

在这里插入图片描述

1.候选区域生成：ROI(Regions of Interst)

Selective Search算法
将图像分割承小区域，合并包含同一物体可能性较高的区域，提取约2000个候选区域
归一化处理，得到固定大小的图像

利用 Selective Search 算法通过图像分割的方法得到一些原始区域，然后利用一些合并策略将这些区域合并，得到一些层次化的区域结构，而这些结构就包含着可能需要的物体。这里的 SS 算法可以详见此处，算法原始论文Selective Search for Object Recognition。（初始区域的获取是引用另一篇论文的：Efficient Graph-Based Image Segmentation）
在这里插入图片描述

在这里插入图片描述

2.CNN提取

将固定大小的图像，利用AlexNet CNN网络得到固定维度的特征输出

3.SVM分类器

线性二分类器对输出特征进行分类
得到是否属于此类的结果，采用难样本挖掘来平衡正负样本的不平衡

在这里插入图片描述

在这里插入图片描述

对2000x20的每一列近NMS处理

在这里插入图片描述

4.位置精修

通过回归器对特征边界回归=Bounding Box regression从而得到更为精准的目标区域
在这里插入图片描述

存在的问题

候选区域需要提前提取并保存，占用空间较大
涉及分类中的全连接网络，所以尺寸是固定的，精度会低
需要多步训练，步骤繁琐且训练速度慢

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eELStFIv-1650618571358)(../../../../../../windows/system32)]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习之图像检测

python

人工智能

神经网络

深度学习

【pytorch目标检测】开山之作：R-CNN算法解读的相关文章

如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
多处理中的动态池大小？

有没有办法动态调整multiprocessing Pool尺寸我正在编写一个简单的服务器进程它会产生工作人员来处理新任务使用multiprocessing Process对于这种情况可能更适合因为工作人员的数量不应该是固定的但我需
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

python脚本实现sql时间盲注

这里用sqli labs master第10关举例 1 爆数据库长度 coding utf 8 import requests import datetime import time 获取数据库名长度 def database len fo
超实用的 linux atop 与 htop 监控工具讲解与实战操作

文章目录一概述 1 atop 概 2 htop 概述二 top atop 和 htop 对比 1 top 2 atop 3 htop 三 atop 与 htop 监控工具安装四 atop 与 htop 命令的基本语法 1 atop
Tcl-5. format 命令

format 命令和 C 语言中的 printf 和 sprintf 命令类似它根据一组格式说明来格式化字符串此命令不会改变被操作字符串的内容语法 format spec value1 value2 spec 变元包含了格式说明关键
VCPKG

VCPKG C C dependency manager from Microsoft For all platforms buildsystems and workflows
java高级编程

java高级编程目录 java高级编程一多线程 1 程序进程线程的理解 1 1程序 1 2进程 1 3线程补充内存结构 2 并行与并发 3 线程的创建和使用 3 1多线程的创建方法一继承于Thread 类 3 2多线程的创建
一文看懂卷积运算（convolution）与互相关运算（cross-correlation）的区别

目录互相关运算定义互相关运算图示互相关运算完整计算示例卷积数学定义卷积运算图示卷积与互相关运算区别深度学习中的卷积为何能用互相关运算代替互相关运算定义在二维互相关运算中卷积窗口从输入数组的最左上方开始按从左往右从上往
JDK动态代理对象与被代理对象地址值问题

JDK动态代理对象与被代理对象地址值问题 1 UserService接口 2 UserServiceImpl接口实现类 3 ProxyFactoryByJDK代理工厂类 4 UserTest测试类 5 结果问题打印userService
3-python包和模块-分类

标准包模块第三方包模块自定义包模块什么是标准模块安装pyhton后电脑上面就存在的一些模块可以直接导入使用 os sys time 每个安装了python的用户电脑上都有这些模块在一台电脑上面使用了系统模块的代码到另外
DataBinding表达式使用bug：databinding javax.xml.bind.UnmarshalException

问题描述使用DataBinding时在XML文件中使用带有中文字符的表达式时程序编译报错 Exception while handling step android databinding annotationprocessor Pr
快速排序—C语言实现

目录前言快速排序实现逻辑 1 hoare版本编辑 2 挖坑法 3 前后指针版本快速排序优化 1 三数取中法选key 2 递归到小的子区间时可以考虑使用插入排序快速排序非递归用栈实现快速排序的特性总结全部代码前言在学数
Flutter--macos环境配置

Flutter macOS环境配置 1 安装去flutter官网下载安装包解压到你想安装的目录 2 配置环境变量命令行open bash profile打开配置文件添加在打开的页面添加上下面代码 export PATH 自己flu
关于RestTemplate使用过程中的两个问题（请求的URL中带有%25，转换的对象属性值与相应的json串中的key值不对应转换失败）

问题一请求的URL中带有 25 解决如果请求的URL中包含号尤其是参数经过URLEncode之后 restTemplate会把转成 25 因此将请求地址封装成URI对象既可例如 User user restTemplate po
内核中的位图介绍(DECLARE_BITMAP宏)

1 DECLARE BITMAP宏定义 define DIV ROUND UP x y x y 1 y 向上取整 define BITS TO LONGS nr DIV ROUND UP nr BITS PER BYTE sizeof lo
影响中国软件人物之：倪光南院士

一个人简况倪光南 1939年8月1日出生于浙江宁波 1994年被遴选为中国工程院首批院士曾担任中科院计算所研究员联想集团总工程师二重要成果 1 1964年参与吴几康主持研制的119机研制项目成功 2 1974年作为计算所代表
vue-cli 安装报错 no such file or directory , access.问题解决。

解决发案第一步查看默认全局安装路径指令 npm config get prefix 复制默认全局安装路径在你的系统显示目录中删除npm文件夹对于大多数系统显示目录为 usr local 第二步 cmd进入到你的项目路径初始化npm就
Java基础 -- 多线程的使用01

Java基础多线程的使用 1 关键字 1 1 并发与并行 1 2 进程和线程 2 Java 线程 2 1 Java的主线程 2 2 线程生命周期 3 Java 线程三种实现 3 1 继承Thread类 3 2 实现Runnable接口 3
python 语言实现一个WEB登陆应用程序

实现一个 Python 语言的 WEB 登录应用程序需要掌握一些基础知识例如 HTTP 协议网络编程加密算法等以下是一个基本的框架供参考熟悉 HTTP 协议和 Web 服务器与客户端的基本通信机制使用 Python 的网络编程
使用Python将pyd文件打包成安装包whl

先说效果可以将一个或多个py文件编译为源码不可见的 pyd文件同时将pyd文件打包为whl文件他人使用时只需要将whl文件发送过去对方通过安装whl文件就可以将你写的代码文件库文件安装到python环境了首先将py代码文件
前后端分离技术逐步深入，让你更加深入理解Nginx+Tomcat

你提到了熟悉Tomcat和Nginx服务器的配置以及应用前后端分离技术请解释一下Tomcat和Nginx的主要作用是什么以及在前后端分离中它们的角色是什么标准回答 Tomcat是一个Java应用服务器主要用于运行Java Web应
【pytorch目标检测】开山之作：R-CNN算法解读

背景将深度学习和传统的计算机视觉的知识相结合没有过多的使用深度学习 2014年将PASCALVOC数据集检测率从35 提升到53 具体步骤总体的步骤图 1 候选区域生成 ROI Regions of Interst Selec

热门标签