Detect-and-Track论文:笔记

2023-05-16

【题目】:《检测-追踪:视频中有效的姿势估计》

【批注】:

这篇CVPR-2018文章算是进复旦/博立的文章阅读首秀吧,一开始以为毕设是要做姿势估计,但是最后做的是MTMC。论文里使用的方法是扩展后的Mask R-CNN,也正是因为这篇文章,才去学习的Detector家族。在未来的研究生涯中具有开天辟地的意义。啊对了,本科毕设还要翻译英文文献,自己翻译的就是这篇,我的妈啊当时翻译了两个星期。(文章涉及到的东西还是很多的)

 

【针对问题】:

针对视频中的复杂多人体关键点追踪问题。(PoseTrack数据集)
           现存的视频姿势分析都是基于手工图模型和帧级别优化的实时方法,都需要对约束条件进行手工设定,不能连接多帧信息。

 

【主要创新】:

整体方法是基于Two-Stage,首先用3D人体姿势预测器检测关键点,然后再用轻量级的优化器去连接这些点。

★ 跨帧的时空姿势估计:
      # 1.主干网络用3D ResNet,初始化方法用均值和中心。
      # 2.将RPN扩展为TPN,对anchor进行cls/reg分析。
      # 3.对RoIAlign进行扩展,提取时空特征。后cls头和point头分别产生类别信息和热图。

★ 链接关键点成为轨迹:
      # 将其视为双向匹配问题,每个人都是一个节点,用Hungarian和Greedy算法完成。距离Metric方式有很多:DL特征、BBox IoU、姿势PCKh、LSTM。

 

 

【实验方法】

这个实验策略666,先在PoseTrack Benchmark上进行Baseline实验,这个实验结果排名第一,然后再在Baseline上放自己的设计。真的是把别人的方法按在地上摩擦~

★ Baseline实验
      # 1.对检测结果的阈值进行改变,观测关键点mAP和MOTA;
      # 2.将Mask R-CNN的backbone网络变深,最终采用ResNet-101+FPN;
      # 3.双向匹配问题对Hungarian和Greedy算法进行对比,采用IoU度量;
      # 4.对追踪损失准则选定进行了实验:DL特征、BBox IoU、姿势PCKh、LSTM,最终为了简便和鲁棒性,选择IoU。
      # 5.上限实验:给定所有的“正确联合”或“正确关键点”,分别看对结果的影响,再对比联合的结果。发现好的姿势估计影响很大。
      # 6.当前最优对比:数据集最近发布,先跟现存的方法对比;
      # 7.运行时间对比:根基于IP的方法对比,速度提升了200多倍;

★ 3D Mask R-CNN实验
      前面balabala讲一堆全都是Baseline,现在才切入正题。考虑到计算量,backbone换成了ResNet-18,与2D的Baseline结果进行了对比,最后显示center中心初始化方案较好。

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Detect-and-Track论文:笔记 的相关文章

随机推荐

  • tf.variable_scope中的reuse

    一 两种scope xff1a variable与name tf variable scope 是对变量进行命名管理 xff0c 而tf name scope 是对算子 op 进行命名管理 xff0c 二者相互不影响 见下例 xff1a i
  • HTML+CSS 简易搜索框

    搜索框是页面中很常见的一种 xff0c 下面分享一段简单搜索框案例 xff0c 直接上代码 HTML部分 lt DOCTYPE html gt lt html gt lt head gt lt meta charset 61 34 UTF
  • frp内网穿刺/反向代理教程

    文章目录 前言一 明确基本概念二 frp下载与使用1 云服务器做为Server端2 GPU服务器做为Client端3 远程访问 三 云服务器防火墙端口开启 前言 frp 是一个高性能的反向代理应用 xff0c 可以帮助开发者轻松地进行内网穿
  • Keras模型基本流程

    文章目录 前言一 Keras流程二 Keras中的模型定义1 基于Sequential 类2 基于函数式API 前言 目前打算看tensorflow probability模块 xff0c 但是发现整个都是适配Keras的 xff0c 很多
  • pytorch自动混合精度训练

    from torch cuda amp import autocast GradScaler Init Step 1 Create Model model device start epoch 61 create model opt if
  • Linux系统查看CPU个数&超线程&线程数

    小命令 xff1a Linux查看CPU详细信息 简书 jianshu com Intel CPU产品规范 xff1a 英特尔 产品 xff1a 处理器 xff0c 英特尔 NUC 迷你电脑 xff0c 内存和存储 xff0c 芯片组 in
  • Tensorflow学习笔记(1)——Tensorflow-CPU版安装躺坑实录

    从今天开始就要出品自己的Tensorflow系列啦 xff01 由于是第一篇关于Python的博文 xff0c 所以先把接触Python以来的感想和心得都放了进来 xff0c 想看Tensorflow的博友请直接跳到标题三 一 Python
  • Tensorflow学习笔记(3)——图、会话基本语法

    前言 xff1a Tensorflow xff0c 与我们之前熟悉的C C 43 43 Python的确不太一样 xff0c 建议初学者当作一门新的语言来学 如果看的过程中忽然有一种 的确不太一样 的感觉 xff0c 并且明白了哪里不一样
  • Tensorflow学习笔记(2)——Tensorflow-GPU版安装总结

    经历了N多次的失败 xff0c TF GPU的环境终于搭建好了 xff0c 全程连着弄了三天 现在把安装中的注意事项总结一下 xff0c 希望大家少走弯路 xff01 先把自己的配置列表说一下 xff1a Windows7 x64 VS20
  • 深度学习基础——彻底掌握卷积层的计算

    机器学习也是刚刚入门 xff0c 虽然对卷积 池化等过程很熟悉 xff0c 但是一直不太清楚具体的计算 xff0c 幸好在博文上看到了讲解过程 xff0c 看完以后受益匪浅 xff0c 然后自己又重新写了一遍 有这个表格 xff0c 再也不
  • Mask R-CNN 简介与论文笔记

    本篇文章是面向Mask R CNN的初学者 xff0c 旨在梳理大体思路 xff0c 认识框架基础概念 由于自己现在大四 xff0c 也是刚刚入足深度学习领域 xff0c 所以文章中免不了有错误之处 xff0c 欢迎各位博友批评指正 本博文
  • Detect-and-Track论文:3D Mask R-CNN Caffe2源代码解析——1.模型构建梳理

    这篇博文的内容是对Detect and Track的源代码进行解析 xff0c 由于是第一篇 xff0c 所以展示的是代码的脉络 xff0c 以及如何寻找到3D Mask R CNN的构建过程 博文的目录是按照文件来的 xff1a 参考内容
  • INRIA数据集

    INRIA数据集 HOG 43 SVM是经典的行人检测方法 xff0c 论文作者同时搞了一个INRIA数据集 INRIA数据集官方页面 xff1a http pascal inrialpes fr data human xff0c 不过说真
  • Detect-and-Track论文:3D Mask R-CNN Caffe2源代码解析——2.ResNet18_3D解析

    在上一篇博文中 xff0c 我们对Detect and Track论文源码中模型构建部分进行了代码梳理 xff0c 此篇博文我们对其采用的主干网络ResNet18进行详细分析 参考内容链接如下 xff1a Detect and Track论
  • Detect-and-Track论文:3D Mask R-CNN Caffe2源代码解析——3.RPN&FPN构建

    在第二部分 xff0c 我们对ResNet18的结构进行了分析 当图像经过ResNet18后 xff0c 会产生Feature Map xff08 特征图 xff09 这些特征图将会被送到RPN xff08 Region Proposal
  • Detect-and-Track论文:3D Mask R-CNN Caffe2源代码解析——4. 网络头解析

    在第三部分 xff0c 我们对3D Mask R CNN的RPN和FPN进行了详解 xff0c 在特征图经过RoIAlign过程之后 xff0c 我们得到了Resize后的特征图 下一步就是将这些维度相同的特征图送入 网络头 Net Hea
  • Docker新手急速入门

    初步接触Docker xff0c 只懂里面最基础的几步操作 xff0c 在此记录下来 xff0c 以防忘记 此博文只讲解了最基础 最核心的几步操作 xff0c 适合新手急速入门 一 简介 Docker是一种容器技术 xff0c 可以理解为
  • Ubuntu环境下CUDA 卸载/安装 指南

    1 CUDA卸载 sudo usr local cuda 8 0 bin uninstall pl sudo rm r usr local cuda 8 0 2 停XServer ctrl 43 alt 43 F1进黑屏 xff08 ctr
  • Ubuntu环境下Nvidia-Driver 卸载/安装 指南

    1 停X Server sudo service lightdm stop 2 卸载之前的Driver sudo usr bin nvidia uninstall 3 给驱动run文件赋予执行权限 sudo chmod a 43 x NVI
  • Detect-and-Track论文:笔记

    题目 xff1a 检测 追踪 xff1a 视频中有效的姿势估计 批注 xff1a 这篇CVPR 2018文章算是进复旦 博立的文章阅读首秀吧 xff0c 一开始以为毕设是要做姿势估计 xff0c 但是最后做的是MTMC 论文里使用的方法是扩