SNIP算法详解（极端尺寸目标检测）

2023-11-02

SNIP算法详解（极端尺寸检测）

- 论文背景

论文背景

论文全称：An Analysis of Scale Invariance in Object Detection – SNIP
论文链接：https://arxiv.org/abs/1711.08189
论文日期：2018.5.25

算法背景

本文主要是对比了已有的目标检测算法，结合算法的优势，提出了本文中的SNIP算法，用于解决检测数据集上尺寸极端变化问题。

数据集背景：
COCO数据集中待检测物体相对图片而言，尺寸过小，而且不同对象之间的尺寸差距较大。针对此类极端尺寸变量问题，即待检测物体尺寸过小或者过大。一些分类与检测算法被提出。
理论基础
检测器的特定尺寸与尺寸不变性设计通过训练不同配置的输入数据来进行比较。
通过评估在ImageNet数据集上不同神经网络结构分类小尺寸对象的表现，也可以得到，CNN对于尺寸变化不鲁棒。

本文提出了一个基于相同尺寸的图片金字塔的训练与测试检测器。

由于小尺寸与大尺寸对象很难分别在较小和较大的尺寸下识别出来，本文提出了一个新的训练方案，图像金字塔的尺寸归一化（SNIP），有选择地反向传播不同尺寸的目标实例的梯度作为图像尺寸的公式。

优化结果
在COCO数据集上，单一模型的准确性为45.7% mAP，三个神经网络一起的准确性为48.3% mAP。使用现成的ImageNet-1000预训练模型，仅仅利用边界框监督训练。

算法详情

主要问题

在过去的几年中，分类取得了很大的进展，但是检测仍然表现不佳。因为检测数据集获取标签的代价太大。除此之外，分类数据集的目标尺寸适中，而检测数据集的对象尺寸偏小，且对象尺寸差异江大，对检测造成了很大影响，尤其是针对小目标的检测是一个很大的挑战。

检测数据集的缺点可以被归纳为两个方面：

对象尺寸小：ImageNet数据集与 COCO数据集目标实例尺寸的中位数分别是0.554与0.106，=意味着 COCO数据集大多数的对象面积都小于整张图片的1%。
对象尺寸差异大：前10%的最小对象尺寸与前10%的最大对象尺寸差异巨大，分别是0.024与0.472。几乎是20倍。

这种尺寸异样对于神经网络的尺寸不变性性能是个极端挑战。
由于预训练是在分类数据集上进行的，

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

目标检测算法

SNIP

scale invariance

image pyramid

Deformable RFCN

SNIP算法详解（极端尺寸目标检测）的相关文章

10003---BootStrap网格系统

Bootstrap 提供了一套响应式移动设备优先的流式网格系统随着屏幕或视口 viewport 尺寸的增加系统会自动分为最多12列什么是网格 Grid 摘自维基百科在平面设计中网格是一种由一系列用于组织内容的相交的直线垂直的
edgewin10无法安装_win10内置Edge浏览器遇到“您未安装FLASH控件”如何解决

win10系统在使用Edge浏览器时可能会遇到您未安装FLASH控件的提示如下图所示这到底是怎么回事一方面可能是你的电脑确实没有安装FLASH插件另一方面可能是由于浏览器禁止的FLASH插件的运行如果没安装就下载要是还是无法
快递100 java 示例API 返回结果乱码之替代方案

快递100官方给出的java 版示例API无法使用返回结果全是乱码只能自己写一个采用httpClient 不采用官方给出的URL方式返回结果编码方式为UTF 8 import java io InputStream import j
vue的v-if，v-show，动态组件，keep-alive

v if 如果条件不成立不会渲染当前指令所在节点的dom元素如果需要频繁切换显示隐藏的元素使用v if则会出现频繁新增删除节点在性能上代价比较高注意最好不要v for和v if同时使用 v for会比v if的优先级高如果连用
get/post请求常见content-type种类

HTTP 请求分为三个部分状态行请求头消息主体在HTTP协议的消息头中通常使用Content Type来表示传值的内容的格式服务端根据Content Type字段对获取消息主体的编码方式对消息解析 get 方法中通过param
js延迟加载的六种方式

1 defer 属性 HTML 4 01 为
基于Python的简单机器学习模型，使用sklearn库的SVM和使用Keras库的深度神经网络

SVM import pandas from sklearn import svm import numpy as np 读取测试集和测试集 train data pandas read csv GroundTruth and Featur
USB信号是什么类型的？为什么在D+，D-处要接上拉下拉电阻呢，具体阻值要如何计算?

usb有主从设备之分主设备有 pc 现在市面上的那些插u disk即可播放mp3的 mp3 之类的 usb 信号是差分信号信号线为D D 在usb host 端 D D 各接一个15kohm 的下拉电阻而在usb device端这时
java并发库之Executors常用的创建ExecutorService的几个方法说明

一线程池的创建我们可以通过ThreadPoolExecutor来创建一个线程池 new ThreadPoolExecutor corePoolSize maximumPoolSize keepAliveTime milliseconds
Vue实现底部导航栏切换页面及图片

前言刚进新公司有幸接触到从前后端不分离到前后端分离的一个过程最开始对vue不太熟悉下班自学一周就开始做了可能会有很多问题若有写不好的地方大佬们可以提出一实现效果需求 vue底部导航点击切换图标效果二大概思路图三代
数据库系统概论第十一章并发控制（3）小结封锁粒度封锁粒度与系统的并发度和并发控制的开销的关系多粒度封锁什么时多粒度封锁多粒度封锁的方法意向锁三种意向锁相容矩阵

第二十三讲封锁的粒度封锁粒度封锁对象的大小称为封锁粒度 Granularity 封锁的对象逻辑单元物理单元例在关系数据库中封锁对象逻辑单元属性值属性值集合元组关系索引项整个索引整个数据库等物理单元页数据
JavaWeb项目中如何让后端的数据传递到前端（包括JSP、JS）

后端传递给前端的方式很多如果是后端传递给JSP 我想大家很多人都知道可以使用后端可以使用 req setAttribute msg msg 前端可以使用或者用JSP的el表达式比如 msg 这边小编重点讲讲如何在JS和后端通信如果
混杂设备动态次设备号分析

今天看驱动源码时发现一个MISC DYNAMIC MINOR宏于是分析了一下内核源码先粘出源码在misc register函数中有如下语句 if misc gt minor MISC DYNAMIC MINOR int i DYN
开始使用OpenCV

开始使用OpenCV 1 编译OpenCV 1 1 使用命令行的方式配置OpenCV OpenCV官网教程 OpenCV官网教程使用命令行的方式进行配置写的很详细按照教程操作一般都能成功由于国内访问GitHub不稳定所以推荐使用w
Python 微信机器人

使用python构造一个微信聊天机器人最近在学python的过程中无意间发现一个python库 wxpy 其可以实现让微信自动接收处理消息并进行回复的一系列功能感觉挺有意思的便自行摸索学习并成功地实现了其功能故写下此博客作学习分

随机推荐

谷歌浏览器插件Automa（入门，编写中，开专栏填坑中）

谷歌浏览器插件Automa 入门编写中 0 待成长的无代码化爬虫 1快速入门模块 1 1 中文设置 1 2 定位你想要操作的位置 1 3 进行操作 1 3 1 点击 1 3 2 输入 1 4 官方案例实战教学 1 4 1 百歌一下 1 4
spring boot 2.0.3 mybatis升级mybatis-plus

项目原来是使用mybtais durid 现升级为mybatis plus2 3 durid mysql 官方文档地址请注意 mybatis plus3 0 的配置有变化请查看官网文档可能是旧的或demo 步骤如下 1 引入pom
Linux中文件的传输

文件在系统中的传输 1 scp 上传 scp 本地文件远程主机用户远程主机ip 远程主机目录步骤如下下载 scp 远程主机用户远程主机ip 远程主机目录本地目录步骤如下 2 rsync 远程同步速度快默认会忽略文件属性
【AnyQ】遇到的问题整理（一）

一编译出错问题描述 In file included from home jockeyyan git repository QuestionAnsweringBot AnyQ build third party paddle src e
分布式计算的基本原理

author skate time 2010 03 08 从最近几次MMI设计会议讨论的结果来看嵌入式程序员对于分布式计算知之甚少他们对分布式计算有种恐惧所以对分布式架构极力排斥而他们的人数又占绝对优势讨论N次 MMI的架构还是没
Jupyter Notebook 工作环境配置

目录背景为什么要配置jupyter的工作环境呢因为可以更方便的找到自己写的脚本所在的文件步骤 1 新建一个文件夹随便在哪里建例如我在D盘新建了一个文件夹 D pythonworkspace 2 接下来配置环境变量新建一个变量W
mysql的sql语句获取两点之间的距离

一张表表的经度和维度都为double或者decimal类型传入参数经度116 366216 纬度39 939834 SELECT ROUND 6378 138 2 ASIN SQRT POW SIN 40 0497810000 PI 1
真难！！！Java初中级岗位都能被卷到怀疑人生....

Java一个初中级岗位有上千人同时竞争内卷程度简直怀疑人生最近不少群友吐槽初中级岗位的面试简直是地狱级难度面试官对常用框架的考察扣的都很细但是在日常开发中又很难注意到这些细节导致吃了很多亏其实说到底还是这个问题主流框架都熟
SQL查询重复数据出现的次数

背景关系型数据库中有这样一种情况假设用户信息表中有一列idCard字段该字段用来存储用户的身份证号现在导入进来一批数据后有人告诉你库里存在重复的数据那么此时你需要重复的规则是什么到底是哪列关键数据出现了重复首先人名重复的情
JVM - 的类加载器（类加载子系统）

文章目录类加载子系统 Class Loader 作用类加载过程加载阶段 Loding 连接阶段 Linking 验证 Verification 准备 Preparation 解析 Resolution 初始化 Initializati
InsightFace_Pytorch人脸识别项目部署运行

一下载InsightFace Pytorch master 二导入各种包三运行take pic py搜集样本四运行face verify py识别遇到问题解决方法 1 导包失败需使用python3 7版本可以安装好 2 找
2023最新C语言经典面试题汇总

写出Bool int 指针变量 float与零值比较的if语句 Bool型 if flag if flag int型 if flag 0 if flag 0 指针变量 if p NULL if p NULL float型 const f
[机器学习与scikit-learn-49]：特征工程-特征选择(降维)-4-二级过滤-特征值与标签之间的关系：卡方过滤

作者主页文火冰糖的硅基工坊文火冰糖王文兵的博客文火冰糖的硅基工坊 CSDN博客本文网址 https blog csdn net HiWangWenBing article details 124073917 目录前言第1章
android软件开发！Jetpack-MVVM-高频提问和解答，附带学习经验

感悟这个世界有一个二八原则在好多地方都发挥着作用在Android开发上我认为也一样有用做一个Android开发你也许只会用到Android开发知识中的20 有80 其实你学了也不一定会用而面试官也一样他也可能只掌握了20 的
java通过JdbcTemplate连接多个（2个以上）不同类型的数据库

1 业务场景要求获取不同数据库的表信息和表结构信息数据库类型包括oracle MySQL SqlServer 2 实现思路 step1 新增数据库连接信息主机端口数据库类型实例名用户名密码状态 step2 测试连接成功状
Python中常用的设计模式

主要参考网址 http www pythontip com pythonPatterns 创建型模式 1 抽象工厂模式 class PetShop def init self animal factory None self pet fac
openstack-helm

文章目录 openstack helm 安装 helm helm 初始化 openstack helm下载 openstack组件安装安装ingress 安装ceph openstack ceph Mariadb RabbitMQ Mem
好用免费的api接口大全

API Application Programming Interface 应用程序接口是一些预先定义的函数或指软件系统不同组成部分衔接的约定目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力而又无需访问原码或理解
【数据库】sqlite版本升级、降级

参考 https www jianshu com p 65923fa3e3dc 1 正常全部使用流程 1 1 定义全局变量 public static SQLiteHelper dbHelper public static String f
SNIP算法详解（极端尺寸目标检测）

SNIP算法详解极端尺寸检测论文背景算法背景算法详情主要问题已有解决方案研究现状思考问题 SNIP算法多尺寸图片分类器对比实验 Deformable RFCN 实例尺寸与数据对检测器的影响实验 SNIP算法细节实验结论

热门标签