OTA:目标检测的最优运输分配

2023-11-01

引言

        该论文主要是关于目标检测中的标签分配问题,作者创新性地从全局的角度重新审视了该问题,并提出将标签分配问题看成是一个最优运输问题。要知道最优传输问题是当前最优化理论和GAN理论研究领域中的一个很火的研究课题。论文的实验效果俱佳,而且作者还提供了相应的源码。

术语介绍:

标签:就是图片的特征。

检测:不但分类而且还有定位盒子(通过盒子中心点和长宽)

分类:建立输入与输出的关系(比如特征),输入是图片,输出是标签,此物的特征;所以说呢,此物的特征是需要做的,而大量训练过后,就找到了特征和联系,再次输入,检测到特征,即输出。

目标特征检测:通过训练大量目标物的坐标,之后输入新的,也会得到特征点

目标检测:通过训练大量目标的坐标,如果输入新的目标物之后,经过训练好的处理后,会得到相应的特征点。这就是所谓的标签分配问题。

最优运输问题:但是在实际问题中绝大多数问题往往都是产销不平衡的,因此就需要将产销不平衡问题转化为产销平衡问题。

1、论文动机

当前基于卷积神经网络的目标检测器是通过预测一组预定义锚点的分类标签进行目标检测。

 术语介绍:

卷积神经网络:某一因素或指标相对于某一事物的重要程度。

单个神经元:

 三级神经网络:

        上图中最左边的原始输入信息称之为输入层,最右边的神经元称之为输出层(上图中输出层只有一个神经元),中间的叫隐藏层。

啥叫输入层、输出层、隐藏层呢?

输入层(Input layer):众多神经元(Neuron)接受大量非线形输入讯息。输入的讯息称为输入向量。
输出层(Output layer):讯息在神经元链接中传输、分析、权衡,形成输出结果。输出的讯息称为输出向量。
隐藏层(Hidden layer):简称“隐层”,是输入层和输出层之间众多神经元和链接组成的各个层面。如果有多个隐藏层,则意味着多个激活函数。

2、论文模型

最优传输理论可以被描述为如下供需关系的形式:假定在一个区域内有m个供应商和n个需求方。第i个供应商有si个单元的货物,第j个需求方需要dj单元的货物。从供应商 到需求者 的单位货物的运输成本为 。最优传输问题的目标是找到一个最优传输方案使得供应商的所有货物可以以最低的运输成本运输给需求方。

以上问题是一个可以在多项式时间内求解的线性规划问题。在目标检测中,这个线性规划问题的规模很大,作者通过采用Sinkhorn-Knopp快速迭代法求解这个线性规划问题。

 术语介绍:

线性规划问题:

在一定条件下,合理安排人力物力等资源,使经济效果达到最好.一般地,求线性目标函数在线性约束条件下的最大值或最小值的问题,统称为线性规划问题。满足线性约束条件的解叫做可行解,由所有可行解组成的集合叫做可行域。决策变量、约束条件、目标函数是线性规划的三要素。

拉格朗日乘数:

        拉格朗日乘数法(Lagrange Multiplier Method)在数学最优问题中,是一种寻找变量受一个或多个条件所限制的多元函数极值的方法。记得以前大学高数、数模等课程多次提到过,在求解最有问题中很有用处,最近重温了下拉格朗日乘数法的思想:拉格朗日乘数法将一个有n个变量与k个约束条件最优化问题转换为一个有n + k个变量的方程组的极值问题,其变量不受任何约束。这种方法引入了一种新的标量未知数,即拉格朗日乘数:约束方程的梯度(gradient)的线性组合里每个向量的系数。此方法的证明牵涉到偏微分,全微分或链法,从而找到能让设出的隐函数的微分为零的未知数的值。

2.1、最优传输理论中的标签分配

 术语介绍:

熵、交叉熵:

        简单来说,嫡是一个用来衡量系统混乱程度的物理学概念。一个系统越混乱,嫡越大,反之,一个系统越有序,嫡越小。而根据嫡增定律,炖这一个物理量,在一个封闭系统内,只能增加或不变不能减少,就好比,如果没有人帮你打扫房间,你的房间只能越来越乱,而不会自动变得整洁有序。所以,如果想要让系统有序,就必须有持续不断的能量从外部输入进来。听到这里你想到了什么?是不是吃饭?没错,从嫡的角度来讲,如果将人体当做一个系统,那么根据嫡增定律,这个系统在没有能量补充的情况下,会逐渐崩溃,慢慢从有序的各种器官、细胞,变的混乱无序,人体也就消亡了。但是,当人类利用吃饭来减少身体的嫡增的时候,通过消化食物产生的热量造成的外部系统嫡增值,永远小于身体系统的嫡减值,在更大的系统视角下,嫡还是增加了。
所以,根据这个定律,我们还会得到一个恐怖的结论,那就是,我们自身,我们生活的人类社会,地球乃至整个宇宙,因为嫡增定律的不可逆效果,最终都将消亡,整个宇宙成为一个处处一样的死寂存在。
IOU:

        交并比,是目标检测中最常用的指标,在anchor-based的方法中,他的作用不仅用来确定正样本和负样本,还可以用来评价输出框(predict box)和真实检测框ground-truth的距离。反映预测检测框与真实检测框的检测效果.       

                                               

FPN:图像金字塔。

  1. 图像中存在不同尺寸的目标,而不同的目标具有不同的特征,利用浅层的特征就可以将简单的目标的区分开来;利用深层的特征可以将复杂的目标区分开来;
  2. 图中我们在第1层(请看绿色标注)输出较大目标的实例分割结果,在第2层输出次大目标的实例检测结果,在第3层输出较小目标的实例分割结果。检测也是一样,我们会在第1层输出简单的目标,第2层输出较复杂的目标,第3层输出复杂的目标。

 2.2、最优传输模型——方法改进

3、实验结果

3.1、消融研究与分析——动态K估计法

3.2、消融研究与分析——“中心先验”

1、我们观看图中的红色箭头和虚线椭圆的部分,这些是检测过程中突出的不明确的区域。

2、由于缺乏上下文和全局信息,可以通过三组图片明显的观察到OTA算法再不确定位置处的积极锚要少,这为提高准确为锚框进行标签分配概率。是种理想的结果。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OTA:目标检测的最优运输分配 的相关文章

随机推荐

  • Makeflow用户手册 一

    Makeflow用户手册 概述 Makeflow是用于大规模分布式计算的工作流引擎 它接受要执行的大量工作的规范 并尽可能在远程计算机上并行运行 此外 Makeflow是容错的 因此您可以使用它来协调非常大的任务 这些任务可能在出现故障时运
  • (4)各个属性角色分析显示-4

    将折线图 数据集 散点图集合在一个html文件中 1 将折线图 数据集 散点图设置为函数a b c 2 再调用page add 函数 将三个图片组合在一起 3 运行page render x html 函数 将该页面命名 打开html文件
  • Java线程中处理运行时异常(UncaughtExceptionHandler)

    线程在执行单元中不允许抛出checked异常 而且线程运行在自己的上下文中 派生它的线程无法直接获得它运行中出现的异常信息 对此 Java为我们提供了UncaughtExceptionHandler接口 当线程在运行过程中出现异常时 会回调
  • ElasticSearch多字段查询best_fields、most_fields和cross_fields理解

    基于elasticsearch7 6 1 和 kibana7 6 1 本文通过案例进行讲解 希望读者耐心阅读 一 介绍 字段中心查询式 就是以字段为中心 代表就是 best fields和most fields 把所有的字段全都散列 然后从
  • 详解曼哈顿距离&欧式距离&切比雪夫距离

    详解曼哈顿 欧式距离 切比雪夫距离 曼哈顿距离 基本概念 出租车几何或曼哈顿距离 Manhattan Distance 是由十九世纪的赫尔曼 闵可夫斯基所创词汇 是种使用在几何度量空间的几何学用语 用以标明两个点在标准坐标系上的绝对轴距总和
  • 基于32单片机的16通道ADC的数据采集

    基于32单片机的16通道ADC的数据采集 这个部分的内容 是作为外部模拟量部分的采集工作 按照任务要求 所设计的方案 需要完成以下指标 ADC必须能采集16通道的模拟量 ADC的分辨率是16bit 采样率不小于20khz 由此分析可以得出
  • 请使用正确的入口登录面板—解决方案

    错误信息提示 解决方案 一 找回安全登录地址 宝塔登录地址 http 你的服务器ip 8888 但是这种格式是不安全的 目前新安装的宝塔面板默认都开启了安全目录登录 所以如果使用这种不带有8位字符随机码的登录地址就会提示 请使用正确的入口登
  • 【AI】《动手学-深度学习-PyTorch版》笔记(二十一):目标检测

    AI学习目录汇总 1 简述 通过前面的学习 已经了解了图像分类模型的原理及实现 图像分类是假定图像中只有一个目标 算法上是对整个图像做的分类 下面我们来学习 目标检测 即从一张图像中找出需要的目标 并标记出位置 2 边界框 边界框 boun
  • xctf攻防世界—Web新手练习区robots单题思路

    xctf攻防世界 Web新手练习区robots单题思路 邱邱邱自强 前言 随着互联网的发展 互联网界的行为也越来越被重视 那么国际互联网界通行的道德规范是什么呢 它就是Robots协议 一 Robots协议是什么 robots协议也叫rob
  • 点击Path环境变量编辑不展开的问题

    分析 将 MYSQL HOME bin移动到 JAVA HOME bin的上面 点击确定 再次点击Path环境变量就会出现编辑不展开的问题 如图所示 分析原因 因为我把两个 MYSQL HOME bin和 JAVA HOME bin一起放在
  • zip、unzip命令使用

    1 zip压缩命令 1 压缩文件 zip test test txt 将text txt文件压缩到test zip文件中 2 压缩文件夹 r zip r attack zip attack 将当前路径下attack文件夹中的文件进行压缩 压
  • assert在debug 和 release版本中的区别

    转自 https blog csdn net panfengsoftware article details 8910468 debug版本与release的不同点 debug版本中含有调试信息 不会对程序进行优化 assert相应的宏会被
  • python-一些坑点

    一些python使用中遇到的坑点 记录一下 同样的问题也可能只是对当前我的环境下有作用 AttributeError module urllib has no attribute splittype 使用urllib中的一些工具时 提示这个
  • FPGA中task语法基本使用

    1 task定义为任务 完成的是某个具体功能 可以在initial语句和always语句中使用 不过initial语句使用较多 2 task如何使用 1 定义任务 task 任务名 端口及数据类型声明语句 语句1 语句2 语句n endta
  • Qt 3D的研究(三):显示3D模型

    Qt 3D的研究 三 显示3D模型 上一篇文章介绍了如何使用最少的代码创建一个Qt 3D的应用 和大家最初接触的glut一样 对于3D应用来说 需要做的准备工作还真不少 不过呢 Qt 3D把一些窗口相关的琐碎事情解决了 剩下的 该由我们完成
  • 修复nanopi2的SPI无法使用50MHZ传输的问题(S5P4418)

    关于S5P4418使用SPI DMA传输时出现的超时问题 一 问题背景 二 启用SPI的DMA传输 2 1 修改cfg main h 文件 2 2 make menuconfig 配置SPI 2 3 修改SPI主机驱动代码 2 4 增加设备
  • vue cmd 创建新项目在指定文件夹

    1 cmd 进入 后 转到指定目录 cd D 2 创建vue新项目 vue create test
  • 基于minikube搭建的SpringBoot实战

    现在比较多的互联网公司都在尝试将微服务迁到云上 这样的能够通过一些成熟的云容器管理平台更为方便地管理微服务集群 从而提高微服务的稳定性 同时也能较好地提升团队开发效率 但是迁云存在一定的技术难点 今天这篇文章主要介绍如何从0开始搭建一套基于
  • 我的世界服务器修改空岛范围,我的世界空岛指令权限大全

    发布时间 2016 08 07 我的世界ess指令是什么 我的世界ess指令在ess插件运行中十分重要的一部分 那么今天小编就为大家带来了我的世界ess指令用法大全 一起看看吧 我的世界ess指令 Essentials插件 用户组权限管理插
  • OTA:目标检测的最优运输分配

    引言 该论文主要是关于目标检测中的标签分配问题 作者创新性地从全局的角度重新审视了该问题 并提出将标签分配问题看成是一个最优运输问题 要知道最优传输问题是当前最优化理论和GAN理论研究领域中的一个很火的研究课题 论文的实验效果俱佳 而且作者