DSST算法详解

2023-05-16

论文: Accurate Scale Estimation for Robust Visual Tracking


Martin Danelljan, Gustav Häger, Fahad Khan, Michael Felsberg.  Accurate Scale Estimation for Robust Visual Tracking.  In Proceedings of the British Machine Vision Conference (BMVC), 2014.



一、引言

论文中主要描述了一种在视觉跟踪中精准的尺度估计的方法,基于此尺度估计方法提出了DSST(Discriminatiive Scale Space Tracker)算法。该算法分为位置滤波器(Translation Filter)和尺度滤波器(Scale Filter)。这种精准的尺度估计方法可以和任意其他的没有尺度估计的跟踪算法结合。下图是作者给出的算法的效果。




DSST算法采用判别相关滤波器(discriminative correlation filters)来确定位置信息,使用文中提出的尺度估计方法确定尺度信息。




二、Discriminative Correlation Filters

位置估计的方法基于MOSSE跟踪方法,算法通过学习得到一个位置的相关滤波器,用这个滤波器来确定目标在下一帧的位置。


MOSSE滤波器使用一组灰度图像块  f1,f2 ,  f3 ….ft作为训练样本,对应的滤波器的响应输出为g1 , g2 ,  g3 …. gt  (通常用高斯函数构建得出) 。最佳相关滤波器ht需要满足下式。





其中  fi,gi ,ht的均为 M x N 的矩阵,星号代表循环相关,第二个等号根据Parseval定理得出。大写字母代表相应的离散傅里叶变换(DFT),上划线表示复共轭。上式最小化结果可得:


在工程实践中,通常把Ht 拆分成分子  At 和分母  Bt  分别进行迭代更新操作。


对于新来的一帧图像中的M x N 的图像Patch z,它的响应得分为 y ,计算方法如下:


y中最大值的位置被认为是目标新位置的估计。通过傅里叶变换加速了训练和检测过程。





三、Discriminative Correlation Filters for Multidimensional Features

考虑到许多图像的特征为多维度的,设 f  特征,f  有d维,f  l  为其中的第l维,l的取值为1到d。那么最小化的cost function为:


λ是正则项。上式中只考虑了一个训练样本。求解得到H为:





同样将H拆分为分子A和分母B,分别进行迭代更新,更新的方法如下:


其中η 表示学习率。对于新来的一帧图像中的图像Patch z,它的响应得分为 y ,计算方法如下:


y中最大值的位置被认为是目标新位置的估计。


四、Exhaustive Scale Space Tracking(一种详尽的尺度空间跟踪方法)



作者提出了一种三维的尺度相关滤波器,滤波器的大小为 M x N x S,M和N分别代表滤波器的Height 和Width, S代表尺度的数量。


f是以上一帧确定的位置为中心,取得一系列不同尺度的图像块的特征。采用三维高斯函数构建三维的滤波响应输出g。同样采用第三部分叙述的方法每次迭代更新模板h。对于新一帧的图片,可以获取S个尺度上的特征组成一个 M x N x S的特征金字塔z,采用第三部分叙述的方法获得响应g,根据g中最大值所在的位置则可以确定位置信息和尺度信息。




五、Fast Scale Space Tracking(一种快速的尺度空间跟踪方法)

作者通过将尺度估计和位置分开计算,提出了一种快速的尺度估计方法。

This helps by restricting the search area to smaller parts of the scalespace. In addition, we gain the freedom of selecting the feature representation for each filterindependently.

采用一个一维的相关滤波去估计目标在图片中的尺度。训练样本f从目标中心扣取。假设当前帧的目标大小为 P x R,尺度为S,我们扣取目标中心大小为 anP× anR的窗口标记为Jn其中a表示一个尺度因子,n的取值范围如下:


尺度等级为n的训练样本 f 是Jn的d维的特征描述子。

在连续的两帧中,位置的变化往往大于尺度的变化,因为,文中先采用位置滤波器确定位置信息,在位置的基础上再使用尺度滤波器确定尺度信息。

六、举例说明

1、位置估计

    训练过程:

    目标所在的图像块P的大小为M x N,提取P的特征(例如Fhog特征),得到大小为 M x N x d 的特征 f  ,其中特征的维度为 d 维。如下图所示(作者选取灰度图为第一维的特征,后续的特征是Fhog的前27维特征),响应g是根据高斯函数构造的,大小为M x N,中间响应值最大,向四周依次递减:


根据下述公式 ,需要对 f  的每一个维度的特征做二维的DFT,得到 F l  ,对 g 做二维的DFT得到 G,下式中的乘法都是点乘,矩阵的对应位置相乘。


将G和F都带入上述等式,可以得到滤波器模板H的值。完成训练过程。

    检测过程:

    新的一帧的图片的特征为z,同样求取每一维度的二维的DFT得到 Z l,每一维度的Z和响应维度模板中的分子相乘再累加得到下式中的分子的值,分母的值已知,则可以很容易求出y。



y的最大值的位置就是新目标中心的位置。这样就确定了位置信息。




2、尺度估计

    训练过程:

     目标所在的图像块P的大小为M x N,以图像块的正中间为中心,截取不同尺度的图片,具体截取图片的大小可以参考第四部分中的方法。这样就能够得到一系列的不同尺度的图像Patch(搜索范围为S个尺度,就会有S张图像Patch),针对每个图像Patch求其特征描述子(维度为 d 维,这里的 d和位置估计中的维度d没有任何关系),g是高斯函数构造的输出响应大小为1 x S,中间值最大,向两端依次减小 。


如果选取33个尺度,那么S=33, 每一个维度的特征  f  l 为 一个1 x S 的向量,对f  的每一个维度的特征做一维的DFT,得到 F l,对 g 做一维的DFT得到 G, 计算过程和位置估计的一样,只是维度变成了一维。同样可以得到滤波器模板H。

    检测过程:

 新的一帧的图片以位置估计得出的位置为中心,截取S个不同尺度的图像Patch,分别求其特征描述子,组成新的特征为z,同样求取每一维度的一维的DFT得到Z l 进而得到y的值(求取方法和位置估计类似),y为 1 × S 维的向量,y 中最大值的所对应的尺度为最终尺度估计的结果。                  

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

DSST算法详解 的相关文章

  • Android系统上层应用能访问底层硬件的简要原理

    Android系统的应用程序是用Java语言编写的 xff0c 而硬件驱动程序是用C语言来实现的 xff0c 那么 xff0c Java接口如何去访问C接口呢 xff1f Android系统架构 xff1a Application Appl
  • Android 10编译报错整理

    编译Android 10遇到以下不同报错 xff0c 没有给出明显的错误信息 xff0c 最后验证出是电脑内存不足导致编译被杀掉 xff0c 增大电脑内存和Swap分区之后解决 注 有关详细信息 请使用 Xlint unchecked 重新
  • vcpkg快速使用教程

    vcpkg是一个自动管理开源库的工具 xff0c 你可以把它想像成Ubuntu的apt get软件包 自动下载开源软件包软件包可以升级版本或补丁包自动编译软件包软件包依赖的包自动检查下载编译可集成至Visual Studio xff0c 你
  • 生产者消费者问题(Producer:1、Consumer:1、Buffer:1)

    生产者消费者问题是一个著名的线程同步问题 xff0c 该问题描述如下 xff1a 有一个生产者在生产产品 xff0c 这些产品将提供给若干个消费者去消费 xff0c 为了使生产者和消费者能并发执行 xff0c 在两者之间设置一个具有多个缓冲
  • (ROS)差分轮式机械臂机器人(二)六轴机械臂Moveit配置&深度相机kinect配置

    上一次搭建出了差分式移动底盘和六轴机械臂 这一次总结机械臂的Moveit配置和底盘kinect深度相机配置 文章目录 项目源码机械臂Moveit配置Moveit具体是什么可以参考 古月居的视频教程 https www bilibili co
  • 操作系统--线程

    线程 什么是是线程 进程中的一条执行流程 线程的优点 一个进程可以同时存在多个线程各个线程之间并发执行各个线程之间共享地址空间和文件等资源 线程的缺点 一个线程崩溃将导致其余所有线程崩溃 线程所需的资源 进程与线程的比较 线程的实现 用户线
  • ros底盘驱动包存在scan跟不上车体运行的错误调试过程

    现象描述 一个和底盘通讯的代码和ros包 总是发现当控制车体运行一段距离 rviz里面scan的数据更新会过一秒才能跟着运动走 同时发现tf的base link也是过一秒才更新 调试过程 起初 以为是串口堵塞 没有及时的接受和处理底盘上行发
  • 变频器电路原理详解经典

    要想做好变频器维修 xff0c 当然了解变频器基础知识是相当重要的 xff0c 也是迫不及待的 下面我们就来分享一下变频器维修基础知识 大家看完后 xff0c 如果有不正确地方 xff0c 望您指正 xff0c 如果觉得还行支持一下 xff
  • UART模块验证-面试总结

    前言 本篇博客依旧针对UART模块的验证项目进行面试总结 xff0c 也是笔者面试过众多公司所总结整理的 关于UART深挖的可问的知识点还是非常多 xff0c 本篇博文可以说基本上涵盖大部分可问到的点 关于下列有一些问题我并没有列出答案 x
  • 你所不知道的C语言——链表内是否有环(龟兔赛跑算法)

    判断链表中是否有环 xff0c 这也是力扣的题 xff1a 141 Linked List Cycle 142 Linked List Cycle II 146 LRU缓存 不多比比 xff0c 直接上代码 xff1a 变量 mu 指的是
  • 古诗文本自动生成唐诗文本生成(算例代码)

    首先准备好一个本地文件 xff0c 在此我命名为唐诗三百首 txt如下图 https img blog csdnimg 图片 代码如下 span class token keyword import span numpy span clas
  • __attribute__ 你知多少?

    GNU C 的一大特色就是 attribute 机制 attribute 可以设置函数属性 xff08 Function Attribute xff09 变量属性 xff08 Variable Attribute xff09 和类型属性 x
  • ChatGPT被淘汰了?Auto-GPT到底有多强

    大家好 xff0c 我是可夫小子 xff0c 关注AIGC 读书和自媒体 解锁更多ChatGPT AI绘画玩法 说Auto GPT淘汰了ChatGPT了 xff0c 显然是营销文案里面的标题党 毕竟它还是基于ChatGPT的API xff0
  • Word+ChatGPT,一分钟完成周报总结作文

    大家好 xff0c 我是可夫小子 xff0c 关注AIGC 读书和自媒体 解锁更多ChatGPT AI绘画玩法 加 xff1a keeepdance xff0c 备注 xff1a chatgpt xff0c 拉你进群 Office 的办公软
  • 两分钟速览谷歌2023IO大会:AI军备竞争,全线出击

    大家好 xff0c 我是可夫小子 xff0c 关注AIGC 读书和自媒体 解锁更多ChatGPT AI绘画玩法 加 xff1a keeepdance xff0c 备注 xff1a chatgpt xff0c 拉你进群 5月10日周三 xff
  • 科大讯飞星火认知大模型:诚意满满、全村希望

    近日 xff0c 科大讯飞召开了星火认知大模型成果发布会 xff0c 会上表示讯飞星火大模型将突破开放式问答 xff0c 对标ChatGPT xff0c 在中文能力上超过ChatGPT xff0c 在英文能力上与ChatGPT相当 对此 x
  • Android NDK tombstone分析工具

    Android NDK tombstone分析工具 在Andoird Native库发生异常的时候 xff0c Linux会发生不同级别的sig xff0c 来结构相关进程的运行 xff0c 同时会产生tombstone trace文件用于
  • 关于UEFI

    最近在Thinkpad上安装Ubuntu12 04的时候 xff0c 经历了几个问题 xff0c 发现BOIS里多了很多选项 xff0c 而且安装双系统也有UEFI有关 xff0c 在网站上找了一篇文章 xff0c 发现这还是一个新概念 x
  • 怎样在github上协同开发

    描述 xff1a How to co work wither parter via github Github协同开发情景模拟 Github不仅有很多开源的项目可以参考 xff0c 同样也是协同开发的最佳工具 xff0c 接下来的就模拟一下
  • Android libdvm.so 与 libart.so

    Android libdvm so 与 libart so 系统升级到5 1之后 xff0c 发现system lib 下面没有libdvm so了 xff0c 只剩下了libart so 对于libart模式 xff0c 从4 4就在De

随机推荐

  • 链表快速排序quick-sort(递归+迭代)

    递归版 直接上代码 span class token keyword static span span class token keyword void span span class token function list qsort s
  • 反向代理--解决跨域问题

    为什么要解决跨域问题 xff1a 因为浏览器有限制 xff0c 只有同域名同端口号下的数据才能拿来用 xff1b 那如果想拿到不同域名不同端口号下的数据就不行了 xff1b 在单文件组件中如何去解决跨域问题 xff1a 因为服务器没有跨域限
  • 写在2011

    很早就想写点东西了 xff0c 可晃荡晃荡地就到了2011年最后一刻 我想是要写点东西了 2011年 xff0c 我有太多的感触 这一年是我第一次在异地迎接农历新年了 xff0c 对 xff0c 当时的感觉很刺激 xff0c 刺激得让我和当
  • Translate Aticle

    最近在Thinkpad上安装Ubuntu12 04的时候 xff0c 经历了几个问题 xff0c 发现BOIS里多了很多选项 xff0c 而且安装双系统也有UEFI有关 xff0c 在网站上找了一篇文章 xff0c 发现这还是一个新概念 x
  • Window64位系统用HSDIS对java代码进行反编译

    1 下载hsdis amd64 dll文件并放入 JAVA HOME jre bin中 xff0c 例如 xff1a C Program Files Java jdk1 8 0 191 jre bin 书上说的是放在 JAVA HOME j
  • golang中的context

    一 Context含义 1 context定义 context是golang中的上下文 goroutine的相关环境快照 xff0c 其中包含函数调用以及涉及的相关的变量值 golang通过Context机制解决一个request中多个go
  • Win10部署Authelia(OAuth2授权框架)

    一 安装docker 二 下载authelia代码 span class token comment 下载代码并切换到本地运行例子 span span class token function git span clone https gi
  • golang并发学习及实战记录

    一 切片append方法不是原子操作 多个协程操作同一个切片 xff0c 使用append方法添加元素时 xff0c 存在并发安全问题 xff0c 需要对append方法加锁 span class token keyword func sp
  • Jetson TX1/TX2搭载RTSO-9003载板刷机及使用JetPack3.3安装软件教程(防踩坑)

    1 烧录Linux系统 1 1 系统要求 最好给主机电脑安装Ubuntu14和Ubuntu16 x86 64系统 Ubuntu18系统不能运行JetPack3 3软件 xff0c 且JetPack3 3安装软件必须在主机Host x86 6
  • Ubuntu系统下ROS安装说明

    1 准备工作 安装前看看有什么更改Ubuntu默认的更新源 xff0c 如果更改了 xff0c 要换回备份的默认的安装源 xff08 etc apt sources list bak xff09 权限设置 用户需要成为 拨出 组的一部分 x
  • 腾讯云服务器上搭建Hadoop伪分布式教程

    1 登陆腾讯云服务器控制台查看内网ip地址 2 更改主机名 修改master ip地址 xff0c 地址改为内网地址 vi etc hosts 172 21 0 修改主机名 vi etc hostname master 重启服务器 rebo
  • 时间序列(二)数据重采样

    数据重采样 时间数据由一个频率转换到另一个频率 降采样 升采样 生成一条带随机值的时间序列 rng 61 pd date range span class hljs string 39 1 1 2011 39 span periods 61
  • linux lib/list_sort.c排序算法

    linux lib list sort c排序算法 没看懂 xff0c 留念一下 patch地址是https www mail archive com linux kernel 64 vger kernel org msg1957556 h
  • RealSenseD345I —— imu + camera标定

    目录 1 标定目的 2 标定准备 3 标定步骤 nbsp nbsp nbsp nbsp 1 IMU标定 nbsp nbsp nbsp
  • 深度学习分类算法系列之 -KNN

    先看一个实例来体会一下什么叫做KNN 已知一堆数据a和一堆数据0 xff0c 然后有一个未知数据c xff0c 要判断c到底属于a还是0 如果是1NN 就找到离C最近的数据 xff0c 离哪一个最近 xff0c 就判断c属于哪一类 如果利用
  • docker注册中心

    docker hub镜像上传 span class token comment 1 修改镜像镜像加速器 span span class token punctuation span root 64 sunrui span class tok
  • http-digest的认证

    摘要认证 digest authentication HTTP1 1提出的基本认证的替代方法 服务器端以nonce进行质询 xff0c 客户端以用户名 xff0c 密码 xff0c nonce xff0c HTTP方法 xff0c 请求的U
  • OSI七层协议和tcp/ip四层协议详解

    谈到网络不能不谈OSI参考模型 xff0c 虽然OSI参考模型的实际应用意义不是很大 xff0c 但其的确对于理解网络协议内部的运作很有帮助 xff0c 也为我们学习网络协议提供了一个很好的参考 在现实网络世界里 xff0c TCP IP协
  • 协议栈概念

    协议栈 xff08 Protocol Stack xff09 是指网络中各层协议的总和 xff0c 其形象的反映了一个网络中文件传输的过程 xff1a 由上层协议到底层协议 xff0c 再由底层协议到上层协议 使用最广泛的是英特网协议栈 x
  • DSST算法详解

    论文 xff1a Accurate Scale Estimation for Robust Visual Tracking Martin Danelljan Gustav H ger Fahad Khan Michael Felsberg