BoT-SORT与Strong-SORT论文对比及思考总结

2023-11-06

BoT-SORT与Strong-SORT论文对比及思考总结

接上篇BoT-SORT论文阅读笔记
并对Strong-SORT论文研读与BoT-SORT的更新点对比有了以下的思考总结
Strong-SORT论文
Strong-SORT代码

通过这两篇论文的阅读以及对作者提供的代码也有细致的通读理解,BoT-SORT代码是基于ByteTrack的基础上进行改进,而Strong-SORT代码是基于原生DeepSort修改,两篇论文有其相似的更新点
论文的改进点方向大致都类似(KF、CMC、Reid特征融合)

一、相同点

1、两者都使用了EMA的方式来对特征进行更新,对于特征池的概念也就没有了,使用的是前一次EMA特征与当前的检测特征做融合操作,具体公式如下:
在这里插入图片描述
其中参数值α = 0.9,由此可以看出每次匹配的特征值都是由之前特征作为基础。

在这里博主在想为什么两篇论文都使用到了这个更新点,不是没有道理的,在原生DeepSort中是使用了一个特征池的概念budget,数量可自由设置,每次更新特征都会将特征放入其中,按照队列形式,此处会出现一个问题,当目标在一个位置长时间不动的时候,特征池里面的特征可能都几乎为相同的特征,而当快速变化时,由于特征池来不及更新,会导致自身特征匹配不上导致id变换,轨迹丢失。而EMA方式可能长时间的不动也仍然存在之前特征的影子,并不是单一的姿态特征。

2、两者都使用了 appearance cost Aa and motion cost Am之间的融合,公式如下:
在这里插入图片描述
参数值λ=0.98,起初没看代码前将Am理解成了iou cost矩阵,实质Am是指的是gating distance(马氏距离值),如果当做是iou cost的话就会陷入一个误区,iou没什么作用,一直都是reid中的特征在做匹配。
而与马氏距离做融合机制会有一个好处就是它会限制reid的匹配距离,虽然说马氏距离值在公式中占的权重少,但是其实是有影响的,由于Aa值在区间[0, 1]之间,而马氏距离值会是一个很大的值,当马氏距离小,C值会比较小,马氏距离大,C值可能会让整体的值更大,对reid匹配起到一个直接不去匹配的作用。

二、不同点
1、BoT-SORT

(1)IOU-fuse (fuse_score)
论文中此策略并未提及,而在阅读代码时确实使用到了,主要是通过计算完的iou cost矩阵后,通过每个检测框与预测框匹配计算完的cost矩阵后,在cost值对应的检测框乘上其检测得分进行融合输出,计算公式可总结为: [1 - (1 - iou_cost) * det_score]

此种方式猜测作者是想通过检测得分低的框做iou匹配时当做不可靠对象来降低最终的匹配得分,不可靠检测可以为遮挡对象或者半身之类的。

(2)IOU-ReID fuse
在BoT-SORT中作者将原生DeepSort的级联匹配(先reid匹配,若reid未匹配成功会进行下一次的iou匹配)修改成单次匹配,通过计算出IOU cost与ReID cost 最后通过融合机制进行判断匹配,公式如下:
在这里插入图片描述
其中注意的是θiou = 0.5,θemb = 0.25,iou值为1-iou表示,主要通过iou的得分与reid的匹配得分做最后的特征余弦相似度融合,去其中两者最小值来决定匹配程度。
(3)卡尔曼预测KF的改进
作者将a = w/h 的预测改成了 w宽度的单独预测,目的是为了能让预测框更好的框住目标。
具体可见BoT-SORT论文阅读笔记
(4)CMC 相机运动补偿
近年来论文貌似都在往这个方向发展,通过外部因素的补偿让预测效果更好,主要原因可能还是因为KF为线性预测方式,而运动为非线性的。
CMC方法作者使用的是ORG全局采样特征角点,前后帧进行特征点匹配计算出其中的变换矩阵来校正预测的矩阵参数从而达到补偿的目的,不过这种方式是非常耗时的,暂在端侧应用不太可行。

2、Strong-SORT

(1)级联匹配中的改进
论文中尚未提及此处改动,通过代码处看到,在级联匹配中,按照原始匹配策略,是通过等级机制一层一层优先匹配,而作者改成了全局匹配,不分层级先后顺序。暂未想到这么匹配有什么好处,有清楚的小伙伴可以互相交流一下呀。
(2)卡尔曼预测KF的改进
作者提出检测的得分高低应该与检测噪声有一个共有关系,若检测得分高,应该相信检测,检测得分低就不太可相信检测,自此作者引用论文GIAOTracker提出的自适应噪声协方差的更新公式如下:
在这里插入图片描述
ck代表的是检测的得分,从而可以通过检测得分自适应噪声协方差的值。
(3)相机运动补偿 ECC
Strong-SORT中作者也使用到了相机运动补偿这个更新点,但是计算的方式不同,ECC方式在耗时方面也存在较大的优势,并且是通过迭代的方式计算最后的校正补偿矩阵。(具体查看代码)
(4)轨迹插值

  • AFLink ( appearance-free link model
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
  • GSI (Gaussian-smoothed interpolation
    在这里插入图片描述
    在这里插入图片描述

论文提及两种轨迹插值的方式,即插即用,看代码时确实也只是分开的方式将这一部分单独作为一大块。GSI是采用高斯平滑插值的方式来拟合无检测更新的轨迹,AFLink是通过轨迹片段训练的小网络作为分类输出判断两个轨迹是否为同一轨迹的相似度得分。
最后总结这两篇论文改进点都比较类似,可作为更新参考点尝试改进,或许会有意想不到的收获!有写的不对的地方,欢迎随时交流!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BoT-SORT与Strong-SORT论文对比及思考总结 的相关文章

随机推荐

  • Centos7 firewall-cmd 命令报错 ModuleNotFoundError: No module named ‘gi‘

    安装了python3的解释器并设置新默认路径后 python是指向python3的 而原来的系统firewall cmd 是命令脚本是使用python2的 而python3没有对应包 需要修改firewall cmd命令脚本 让它依旧使用p
  • 十二条后端开发经验分享,总有一条你不知道

    前言 本文是博主从事后端开发以来 对公司 个人项目的经验总结 包含代码编写 功能推荐 第三方库使用及优雅配置等 希望大家看到都能有所收获 博主github地址 https github com wayn111 一 优雅的进行线程池异常处理
  • SQL语句中对时间字段进行区间查询

    title SQL语句中对时间字段进行区间查询 created 2022 03 15T01 31 14 505Z modified 2022 03 15T01 48 07 370Z SQL语句中对时间字段进行区间查询 当项目中需要查询某一段
  • docker安装mysql8 并且忽略大小写问题解决

    一 docker安装mysql8 1 拉取镜像 docker pull mysql 2 docker安装mysql 只需要执行docker run name mysq db p 3306 3306 e MYSQL ROOT PASSWORD
  • WebSocket:最简单的实现方式——>初学者。WebSocket注入Service的方法。

    使用本方法不需要任何jar包 但是需要引用tomcat 不然无法引用注释 ServerEndpoint var ws new WebSocket url protocol url 指定连接的服务器 protocol 可接受的子协议 var
  • python中的pygame使用_python 中的pygame的一些基本使用总结

    什么是pygame pygame是一个python中的一个游戏库 用于2D游戏的开发 下面是关于pygame的一些常用方法 首先 需要导入 import pygame 窗口的相关操作 创建一个窗口 screen pygame display
  • verilog HDL +UART实验+数码管动态显示

    功能 板子接受通过RS232接受串口调试助手发送的一个字节数据 然后将其转化成0 255的十进制数 在4位数码管上 显示出来 只用到了3位 不用的位熄灭 只有有数字的位才显示 说明 UART部分还是参考特权的Verilog程序 谢谢前辈啊
  • 人脸图像数据增强

    为什么要做数据增强 在计算机视觉相关任务中 数据增强 Data Augmentation 是一种常用的技术 用于扩展训练数据集的多样性 它包括对原始图像进行一系列随机或有规律的变换 以生成新的训练样本 数据增强的主要目的是增加模型的泛化能力
  • 技术前言 - 芯片制造工序详解

    制造工序 芯片简介 工序简介 硅片制造 生产流程 行业壁垒 IC设计 设计流程 行业壁垒 芯片制造 封装测试 制造流程 封装测试 行业壁垒 九大核心设备 参考文档 芯片简介 种类 1 按照性质 数字 模拟芯片 2 按照用途 计算机 家电 手
  • 对象检测工具包mmdetection简介、安装及测试代码

    mmdetection是商汤和港中文大学联合开源的基于PyTorch的对象检测工具包 属于香港中文大学多媒体实验室open mmlab项目的一部分 该工具包提供了已公开发表的多种流行的检测组件 通过这些组件的组合可以迅速搭建出各种检测框架
  • 常用序列的MATLAB代码(一)

    1 典型序列函数 1 单位冲激序列 function x n impseq n0 ns nf ns 序列的起点 nf 序列的终点 n0 序列在n0处有一个单位脉冲 x 产生的单位采样序列 n 产生序列的位置信息 n ns nf x n n0
  • vue-cli 3.0 使用 npm 报错

    问题 vue cli 3 0 使用 npm 报错 最近 vue 项目打算 使用 vue cli 3 0 生成模板 全部默认 配置 生成模板后 使用了 npm 安装依赖后 项目不能正常运行 看npm install 后的执行 代码 好像在 不
  • 老孙的爬虫(四)-------储存多层次的数据,使用递归不断请求,设置id与p_id确定数据的父子关系

    测试网站 https d qianzhan com xdata list xfyyy0yyIxPyywyy2xDxfd html 数据的储存要求 储存的数据能看出父子关系 思路 因为该网站数据是层层打开的 使用递归不断请求 需要额外储存一些
  • PB错误代码

    string ls msgchoose case error number case 1 by zero ls msg 发生被 0 除错误 case 2 2 Null object reference ls msg 空对象引用 case 3
  • 自动实现的属性-Auto-Implemented Properties

    自动实现的属性 C 编程指南 2015 07 20 作者 在 C 3 0 及更高版本 当属性访问器中不需要任何其他逻辑时 自动实现的属性会使属性声明更加简洁 它们还允许客户端代码创建对象 当你声明以下示例中所示的属性时 编译器将创建仅可以通
  • 影视剪辑,视频剪辑流程,如何进行混剪

    一个人如何在家自学剪辑 今天经验分享来啦 视频剪辑流程 一 建立好项目文件夹 根据时间 地点 大体拍摄内容等分类 在不同的文件夹存入对应的物料和工程 二 获取素材 提前收集好要用的包装素材与音乐网站 进行及时补充素材 三 回看和分类 按照脚
  • 磁链

    1 定义 为通电线圈的匝数与磁通量的乘积 通常用 lambda 或 psi 标记 即 N 或 N 其国际单位制单位与磁通量同为韦伯 由于法拉第对电磁学的解释 一个线圈的磁链也可以表示为通过线圈的电压对其时间的积分 即 因此其单位也可以用伏特
  • 阿里云SDK上传视频

    1 老样子 先看效果图 2 首先到阿里云下载所需要用到的SDK 3 下载好的 解压之后 目录以及运行起来是以下这个样子的 4 在实际项目中引用 先将SDK添加到项目中 放到public目录下 5 在public文件下的index html引
  • GDI映射:设备坐标与逻辑坐标

    1 设备坐标 对显示器而言就是屏幕 其单位是像素 对打印机而言就是打印机的像素点 这个坐标与具体的设备相关 所以叫设备坐标 目前用到的就是显示器的像素 显示器的设备坐标有三种 屏幕坐标 窗口坐标 客户区坐标 屏幕坐标 以整个屏幕为显示区 屏
  • BoT-SORT与Strong-SORT论文对比及思考总结

    BoT SORT与Strong SORT论文对比及思考总结 接上篇BoT SORT论文阅读笔记 并对Strong SORT论文研读与BoT SORT的更新点对比有了以下的思考总结 Strong SORT论文 Strong SORT代码 通过