《Ordinal Depth Supervision for 3D Human Pose Estimation》-CVPR2018 论文阅读

2023-10-31

简介

Ordinal Depth Supervision for 3D Human Pose Estimation》是一篇CVPR2018 Oral Presentation的工作,主要解决RGB的3D human pose estimation任务,也是当前的state-of-the-art.
这里对这篇文章做一个简单的总结,如有理解不对的地方,欢迎指正!!

方法

总结一下文章的中心思想,也就是下面的Figure1:

fugure1

文章最创新的地方在于提出了用Ordinal的思想在辅助3D人体姿态估计任务的训练,2D标注的人体姿态估计数据库很多,比如COCO,MPII,FLIC…,并且具有多样性,也就是In-the-Wild的图片,但是3D人体姿态估计的数据库往往是在室内受限场景下面采集的(比如Human3.6M),场景单一,这样的环境下面训练的CNN模型很容易过拟合,导致对于自然图片无法很好的进行泛化。因此作者采用标注In-the-Wild的图片的Ordinal Depth的方法,使得CNN可以在In-the-Wild的图片上进行训练。

所谓的Ordinal Depth,就是关节点之间的相对深度,不需要知道每一个关节点的绝对物理深度,只需要知道关节点的深度顺序即可,这样我们同样可以采取Ranking Loss的监督进行网络的训练。如下图所示:
Fugure2

可以看到,网络预测的深度并不直接进行监督,而是采用深度值之间的大小关系进行Ranking监督,每一对关节点都可以构成一个loss,最后加和,这样就使得网络的训练成为可能。

那么如何充分利用In-the-Wild图片的2D标注呢?也就是结合2D关节点的GroundTruth同时对网络进行监督,很简单,使网络同时输出2D关节点的像素坐标以及3D的Depth值就可以:
Figure3

这里作者使用的同时回归2D keypoints以及Ordinal Depth的方法,并不是直接对绝对位置进行回归,而是采用了“Volumetric Prediction”的方式,也就是说最后预测的是一个3维的Volume,其实也就是2D的HeatMap的拓展:

Figure4

值得注意的是,这个方法也是该作者的团队在CVPR2017年提出的工作:《Coarse-to-Fine Volumetric Prediction for Single-Image 3D Human Pose》。通过预测每一个像素值的3D的Likelihood,最后取Max得到3D的坐标位置:

Figure5

最后的Loss由2D的关节点L2损失以及Ordinal Depth Ranking Loss构成。这就解决了使用Ordinal Depth进行In-the-Wild图片的3D人体姿态估计问题。

在此之前,都是在介绍怎么使用Ordinal Depth在In-the-Wild图片上进行3D Pose的估计,进一步,如何将3D人体姿态估计数据库中的3D Pose也利用上呢?作者的做法是添加一个Reconstruction模块,输入Ordinal的Depth,输出实际物理距离的Depth:

Figure6

这样,3D的人体姿态估计数据库就可以也用来训练这个模型了,新增的Reconstruction模块可以很容易的嵌入到目前的网络中去(几个全连接层而已):

Figure7

结果

在Human3.6M,MPI-INF-3DHP等几个数据库上面都是state-of-the-art:

Figure8

更多的实验结果可以去看作者的原文,包括Ablation验证各个component的效果以及最后各个数据库上面报告的结果。

最后给几个数据库的链接:
Human3.6M:http://vision.imar.ro/human3.6m/description.php
COCO关节点:http://cocodataset.org/#keypoints-2017
MPII:http://human-pose.mpi-inf.mpg.de/
LSP:http://sam.johnson.io/research/lsp.html

当然还有这篇文章的项目主页:https://www.seas.upenn.edu/~pavlakos/projects/ordinal/
里面包括了本文的文章、补充材料、代码以及数据。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

《Ordinal Depth Supervision for 3D Human Pose Estimation》-CVPR2018 论文阅读 的相关文章

随机推荐

  • SQLite3 操作命令以及c/c++编程API和例子

    文章目录 数据库系统 SQLite SQLite数据类型 SQLite语句介绍 表的创建和查看 表的删除插入和修改 表数据的删除 复制表和修改表结构 事务处理 函数操作 数据分组group by 约束 联结表 视图view 触发器trigg
  • 2020新型冠状病毒肺炎的传播分析及对经济的影响

    新型冠状病毒肺炎 COVID 19 的传播分析及对经济的影响 新型冠状病毒肺炎 COVID 19 的传播分析及对经济的影响体现在哪些方面 这种题怎么做 请你建立 COVID 19 传播的数学模型 定量地研究传染病的传播规律 利用所给 不限于
  • MySQL 索引详解

    MySQL 索引 作用 约束 加速查找 一 索引分类 1 普通索引 加速查找 2 主键索引 加速查找 约束 不能为空 唯一 3 唯一索引 加速查找 唯一 4 联合索引 多列 联合主键索引 联合唯一索引 联合普通索引 前三个是单列 字段 索引
  • Spring之Bean循环依赖详解

    今天要说的是spring中循环依赖的问题 最近有大量粉丝问这个问题 也是高薪面试中经常会被问到的一个问题 关于循环依赖的问题 来感受一下连环炮 试试自己否可以过关斩将 轻松应对 什么是循环依赖 如何检测是否存在循环依赖 如何解决循环依赖 多
  • flask-表单提交 弹窗 跳转页面

    问题 在用flask的过程中 遇到一个问题 就是想提交一个表单之后弹出一个提交成功 然后跳转到另一个页面 但是如果用submit 则无法跳转 用button不能提交 最后还是选择了用submit 然后在 py里面进行重定向 前端页面x ht
  • 浏览器网页截屏妙用Capture node screenshot

    1 常用场景和工具 通常我们在PC端截屏时可能会用到一些截屏工具 比如微信截图 键盘Print Screen键屏幕截屏 360浏览器截屏 但是有时候网页页面尺寸很大 或者截屏像素要求很高应该怎么搞处理呢 2 Capture node scr
  • 路径之谜 (蓝桥杯)

    文章目录 路径之谜 思路 AC代码 路径之谜 描述 题目描述 小明冒充 X 星球的骑士 进入了一个奇怪的城堡 城堡里边什么都没有 只有方形石头铺成的地面 假设城堡地面是 n n 个方格 如下图所示 按习俗 骑士要从西北角走到东南角 可以横向
  • e签宝,「进化」在2023

    精准布局生态化 统一化 智能化 信创化 辅以具体产品落地 加速产业 行业 企业 业务 四业 互通互联 提高产业数字化渗透率 电子签 群战 时代 e签宝再次进化 作者 斗斗 出品 产业家 印章在谁手上 印章负责人离职后 是否了解交接流程 印章
  • SpringBoot实践-导入jar包中的配置文件

    事件起因 开发的项目需要依赖一个本地jar包 无法通过maven直接下载 而这个jar包中含有配置文件 在配置文件中定义了spring的bean 而我的项目需要用到这个bean 开发工具 IDEA JDK版本 1 7 使用框架 Spring
  • 在各种开发项目中使用公用类库的扩展方法,通过上下文方式快速调用处理函数

    Python微信订餐小程序课程视频 https edu csdn net course detail 36074 Python实战量化交易理财系统 https edu csdn net course detail 35475 不管我们开发是
  • 搭建一个vue2项目

    一 安装node环境 1 下载地址为 https nodejs org en 2 检查是否安装成功 如果输出版本号 说明我们安装node环境成功 3 为了提高我们的效率 可以使用淘宝的镜像 http npm taobao org 输入 np
  • JeeSite 4.0 功能权限管理基础(Shiro)

    2019独角兽企业重金招聘Python工程师标准 gt gt gt Shiro是Apache的一个开源框架 是一个权限管理的框架 实现用户认证 用户授权等 只要有用户参与一般都要有权限管理 权限管理实现对用户访问系统的控制 按照安全规则或者
  • JSer做的模式悬浮窗体与Jquery做的分页

    今天在做web开发 上网搜索资料时 无意间发现了JSer 现简单介绍一下JSer JSer是一款类似于jQuery的开源脚本框架 使用JSer 将极大的简化您的javascript开发 使程序代码更加简洁和高效 使用JSer 您几乎无需再考
  • 这本Python入门畅销书《“笨办法”学python 3》,不仅仅是一本书

    此前 小编分享过一篇文章 跟着数百万人编程导师学C语言 介绍的是泽德 A 肖大神的新书 笨办法 学C语言 很多用户在后台留言 笨办法 学Python 3 什么时候出版 今天这本书终于在六月初与大家见面啦 与作者其他的图书风格一样 笨办法 学
  • centos7.9单机版安装oracle19c与rockylinux安装单机版21c

    oracle19C安装 Database Software Downloads Oraclehttps www oracle com database technologies oracle database software downlo
  • JAVA面试知识整理

    1 我们是根据什么创建一个表 数据库范式 2 数据库范式 第一范式 数据表的原子性 创建表的字段的时候 每个字段列不可再分出更多的字段 第二范式 在第一范式基础上 表需要一个唯一的字段为主键 通过主键可以快速的找到每一条数据 第三范式 在第
  • jupyter中使用matplotlib

    小试牛刀 matplotlib可能是Python 2D绘图领域使用最广泛的库了 它能够让使用者轻松地将数据图形化 并且提供多样化的输出格式 同时 它几乎能够对图进行所有你能够想到的细节的修饰 我们先来看看一个小例子 In 1 matplot
  • 【01】-迟来的毕设进度记录-【场景搭建、photon实时实现联机(二)】

    嗨我又回来了 今天的任务是 场景KO掉啦 大概基础就这样 植被细节接着弄 重大突破 在动画方面进行了修改 如下图 思路是 玩家按下鼠标左键直接攻击播放攻击动画 不需要bool繁琐的判断 代码也简化 而且之前有BUG 就是玩家按着鼠标左键时
  • SQL ORDER BY 关键字

    ORDER BY 关键字用于对结果集进行排序 SQL ORDER BY 关键字 ORDER BY 关键字用于对结果集按照一个列或者多个列进行排序 ORDER BY 关键字默认按照升序对记录进行排序 如果需要按照降序对记录进行排序 您可以使用
  • 《Ordinal Depth Supervision for 3D Human Pose Estimation》-CVPR2018 论文阅读

    简介 Ordinal Depth Supervision for 3D Human Pose Estimation 是一篇CVPR2018 Oral Presentation的工作 主要解决RGB的3D human pose estimat