人体姿态估计--RMPE: Regional Multi-Person Pose Estimation

2023-11-12

RMPE: Regional Multi-Person Pose Estimation
ICCV2017
Code is based Caffe and Torch!
https://github.com/MVIG-SJTU/RMPE
https://github.com/MVIG-SJTU/AlphaPose

多人人体姿态估计本文解决思路: 多人检测+单人人体姿态估计 Faster-RCNN + SPPE Stacked Hourglass model
对 SPPE 进行了改进,引入了 三个模块: Symmetric Spatial Transformer Network (SSTN),
Parametric Pose Non-Maximum-Suppression(NMS), and Pose-Guided Proposals Generator (PGPG)

多人人体姿态估计目前主要有两类方法: two-step framework 和 part-based framework
two-step framework:先将每个人检测出来,用矩形框框出来,然后对每个人独立的进行人体姿态估计
part-based framework: 首先将人体 body parts 全部检测出来,然后 组装这些部件形成多人姿态估计。

这里我们采用 two-step framework:Faster-RCNN + SPPE Stacked Hourglass model,下图显示存在的问题
这里写图片描述

这里写图片描述

主要的问题有两个: localization error problem 和 redundant detection problem
SPPE 对于矩形框位置误差很敏感。SPPE 对每个矩形框都会产生一个姿态,所以重复检测导致了冗余姿态

为了解决上述两个问题, 我们提出一个 regional multi-person pose estimation (RMPE) framework

这里写图片描述

3 Regional Multi-person Pose Estimation
首先用人体检测器得到 human bounding boxes, 可以用 SSD 或 Faster R-CNN。然后将这些人体矩形框输入 “Symmetric STN + SPPE” 模块,自动输出 pose proposals,对这些 pose proposals 我们用 parametric Pose NMS 微调得到 最终的 人体姿态估计。

在训练阶段,我们引入 “Parallel SPPE” 来避免局部最小值,提升 SSTN 性能。The Parallel SPPE acts as an extra regularizer during the training phase
为了增强已有的训练样本,我们设计了 pose-guided proposals generator (PGPG)。

3.1. Symmetric STN and Parallel SPPE
由人体检测器得到的单人矩形框作为 SPPE的输入不是很合适。这是因为 SPPE 是针对单人图像训练的,对人体定位误差很敏感。实验中发现单人矩形框小的平移或裁剪对SPPE的性能影响很大。我们引入 对称STN+平行 SPPE 来提升SPPE的性能,减少单人矩形框小偏差的影响。

这里写图片描述

4 Experiments
这里写图片描述

这里写图片描述

11

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人体姿态估计--RMPE: Regional Multi-Person Pose Estimation 的相关文章

  • Terdata 基础 第三课(参数宏)

    1 宏不是ANSI标准支持的 但大部分RDBMS都支持宏 在Teradata中 在ANSI和BTET缺省模式下都可以创建和执行宏 只不过在ANSI模式下会给出警告信息 1 1 参数宏 宏中可以包含可替代值的变量 CREATE MACRO d
  • linux shell 按行循环读入文件方法

    linux shell 按行循环读入文件常用代码如下 bin bash printf n echo cat file whiel read line cat test txt while read line do echo line don
  • wofstream,wcout无法输出unicode的真相

    之前我转载过一篇ofstream和wofstream与中文输出问题 让我初步知道如何解决这类问题 第一次我没有在意 按照文章中做的方法去做 然后程序就运行正常了 我试图去记住这些规则 但是我后来发现 太难了 以至于我在最近一次使用到 std
  • 程序编程代码大全_CNC加工中心程序代码大全,数控加工必备!

    数控机床的可编程功能分为两类 一类用来实现刀具轨迹控制即各进给轴的运动 如直线 圆弧插补 进给控制 坐标系原点偏置及变换 尺寸单位设定 刀具偏置及补偿等 这一类功能被称为准备功能 以字母G以及两位数字组成 也被称为G代码 另一类功能被称为辅
  • 免费赠票

    Cloud Ace 受邀参加 GTC2022 全球流量大会 助力中国企业扬帆出海 大会将在 2023 年 2 月 28 日 3 月 1 日举行 地点就在福田会展中心 6 号展馆 大会门票实行收费制 您可以扫码填写 Cloud Ace 的报名
  • GLSL语言基础

    定义 GLSL释义叫做OpenGL着色器编程语言 是为图形计算量身定制的 它包含一些针对向量和矩阵操作的有用特性 变量名字 变量名称的命名规范与C语言相同 可以使用字母 数字 以及下划线来组成变量的名字 但数字不能作为变量名称的第一个字符
  • OBS直播软件-简介

    转自 https jingyan baidu com article e2284b2b90c4dee2e6118dd3 html OBS直播软件是一款国外开发的用于网络直播的软件 本篇OBS教程主要介绍OBS下载和初级应用 工具 原料 一台
  • Open3D 最小二乘拟合空间直线(方法一)

    目录 一 算法原理 1 空间直线 2 最小二乘法拟合 二 代码实现 三 结果展示 本文由CSDN点云侠原创 原文链接 如果你不是在点云侠的博客中看到该文章 那么此处便是不要脸的爬虫 一 算法原理 1 空间直线 x
  • MySQL环境搭建利器---Sandbox

    MySQL环境搭建利器 Sandbox https metacpan org pod MySQL Sandbox http mysqlsandbox net https www cnblogs com gomysql p 3767445 h
  • Java中Arrays类的常用方法

    Java中Arrays类的常用方法 Arrays类位于 java util 包中 主要包含了操作数组的各种方法 import java util Arrays Arrays fill 填充数组 int arr new int 5 新建一个大
  • pycharm使用中的小tip

    1 双击shift会弹出全局搜索功能 关闭 双击shift 打开全局搜索 action gt registry 找到ide suppress dounle hangler勾上 重新打开 ctrl shift a 2 快速格式化代码 ctrl
  • pytorch 实现SSD详细理解 (一)vgg和特征图的提取

    摘要 本章就开始进入SSD的学习 通过学习这些基础的目标检测算法更好的对比理解其它算法 多看几种代码的写法更容易找到适合自己书写的套路 ssd网络的6个特征图 ssd采用的是vgg16的特征提取 在vgg16中提取二个特征图 之后又通过额外
  • Linux高性能I/O框架库Libevent介绍

    C C Linux服务器开发 后台架构师知识体系 这篇文章主要讲一下Libevent库的内容 顺便对I O库整体做个介绍 Linux服务器程序必须处理的三类事件 I O事件 信号 定时事件 在处理这三类事件时我们通常需要考虑如下三个问题 统
  • 解决Action和Servlet共存问题

    一 问题的提出 先让我们看下 web xml 中 struts2 和 servlet 的配置
  • 程序员的生活1

    记录最近生活 最近用C Winform DevExpress InstallShield 开发数据管理及分析软件 在懵懵懂懂的路上 越走越远 项目也差不多进行了一年 当然也会在后期 陆续更新项目上相关的东西 虽然界面很丑 但学习的热情不能因
  • matlab的gscale函数

    function g gscale f varargin if length varargin 0 method full8 else method varargin 1 end if strcmp class f double max f
  • selenium元素等待

    元素等待 js代码执行渲染期间 导致数据 标签加载缓慢 如果元素没有加载完成 直接通过find element去进行定位 会出现元素不存在的异常 3种方法 1 time sleep 10 强制性等待 不管元素在设置时间范围内是否加载出来 都
  • NOIP中的数学---第3课 约数

    约数定义 思考三秒钟 注意约数是成对出现的 如果数a能被数b整除 a就叫做 b 的倍数 b就叫做a的约数 约数和倍数都表示一个整数与另一个整数的关系 不能单独存在 最大公约数是指两个或多个整数共有约数中最大的一个 例如 24 18 共同的约
  • Redis缓存知识-穿透、击穿、雪崩

    目录 一 Redis介绍 二 Redis做缓存服务器 三 缓存穿透 击穿 雪崩 1 缓存穿透 2 缓存击穿 3 缓存雪崩 大家好 我是杨叔 每天进步一点点 关注我的微信公众号 程序员杨叔 获取更多测试开发技术知识 今天分享的内容是 Redi

随机推荐

  • 安卓(Android studio)编写一个计算器,可以连续加减乘除,可加小数点,不包含括号以及加减乘除优先算法。

    安卓 Android studio 编写一个计算器 可以累加 可加小数点 不包含括号以及加减乘除优先算法 首先需要在res目录下的layout文件下创建一个xml文件进行界面的布局设计 接着在Java目录下创建一个Java的class类文件
  • 折纸问题——打印折痕方向

    题目 请把一段纸条竖着放在桌子上 然后从纸条的下边向上方对折1次 压出折痕后展开 此时 折痕是凹下去的 即折痕突起的方向指向纸条的背面 如果从纸条的下边向上方连续对折2 次 压出折痕后展开 此时有三条折痕 从上到下依次是下折痕 下折痕和上折
  • Zabbix监控httpd服务

    Zabbix监控httpd服务 一 工作要求及目的 二 WEB配置步骤 1 进入监控主机列表 2 链接模板 3 查看自定义HTTP端口监控项 4 查看自定义的触发器 三 客户端测试http服务停止报警 1 停止服务 2 查看web端报警 3
  • 去除百度推广的广告

    在百度搜索过的关键字后 经常在其他网页看到百度的推广广告 超级烦人而且涉及隐私 下面是去除方法 C Windows System32 drivers etc下的hosts文件 加入 127 0 0 1 cpro baidu com 127
  • 理解目标检测当中的mAP

    我们在评价一个目标检测算法的 好坏 程度的时候 往往采用的是pascal voc 2012的评价标准mAP 网上一些资料博客参差不齐 缺乏直观易懂的正确说明 希望这篇博文能够给大家一点帮助 mAP历史 目标检测的mAP计算方式在2010年的
  • 【PBR系列二】辐射度量学理论

    本文核心知识主要参照 现代计算机图形学入门 闫令琪课程课件PPT 后续光线追踪系列辐射度量学知识也源于此处 辐射度量学理论 在开始之前我们先思考 为什么学习辐射度量学 辐射度量学是基于物理光照的基础 一 辐射能和辐射通量 辐射能 Radia
  • 员工管理系统服务器,员工管理系统小结 - 四七的个人空间 - OSCHINA - 中文开源技术交流社区...

    练习中出现 DAO层 Service层 Controler层 entity 层 utils 层 mapper 层 想知道几个之间的关系是如何 分层的目的是 高内聚 低耦合 DAO层 接口 也叫数据访问层 做的是数据持久层的工作 负责与数据库
  • Difference between RTL and Behavioral verilog

    原文链接 https electronics stackexchange com questions 63682 difference between rtl and behavioral verilog Answer 1 ehaviora
  • 详解KVM虚拟化原理

    详解KVM虚拟化原理 KVM架构 KVM Kernel based Virtual Machine 包含一个为处理器提供底层虚拟化 可加载的核心 模块kvm ko kvm intel ko或kvm amd ko 使用QEMU QEMU KV
  • sqlserver登录名和用户名的区别和联系-先存着-后续研究

    总括 登录名可以理解为进入整个大楼的钥匙 用户名可以理解为一个房间的钥匙 这里所说的大楼就是sql server服务器 而房间就是这个sql server服务器中的具体的库 要注意登录名是存在于master数据库的syslogins表中 用
  • 底部导航栏怎么写?

    底部导航栏需要怎么写 1 回忆一下 任何手机商城页面 底部导航栏都算固定在下面的 不管页面内容有多少 不管用户怎么滑动 底部导航栏始终在下面 2 点击到导航栏上的图标或者文字时 会跳转另一页面 3 点击导航栏上的图标或者文字时 所点的图标可
  • 爬取学校网站

    完整代码如下 可直接copy from bs4 import BeautifulSoup from bs4 import UnicodeDammit import urllib request import threading def im
  • 源码分析Hadoop FileInputFormat如何分片

    Hadoop采用的是分布式并行计算的模式来处理大数据 在处理时必然要对数据进行分片 将数据由大化小 将一个大的任务化为几个小的任务 这就是hadoop处理大数据的核心思想 这里要讨论的是hadoop对数据进行分片的方案 这里的分片是逻辑上的
  • 开发文档怎么编写_需求开发之软需编写技巧

    一 什么是软需 软需全称软件需求规格说明书 是产品 项目在研发过程中必不可少的一份过程文档 主要由产品 项目的需求人员负责编写 编写软需之前一般要先进行用户需求分析 二 软需的作用 软需的编写时间一般是安排在需求确定之后 代码编写之前 因为
  • python处理字节流形式的视频

    python处理内存中字节流形式的视频 在使用python的streamlit库处理上传的文件时碰到一个问题 文件上传后是以字节数组的形式存在内存中 我在后续需要使用cv2库逐帧操作上传的视频 这里就产生一个问题 cv2怎么读取到内存中字节
  • Android 12 应用兼容性适配指导

    一 兼容性调试工具 Android 11开始引入了新的工具 可针对Android新平台中的行为变更进行测试和调试 这些工具是兼容性框架的一部分 该框架使得开发者可通过开发者选项或adb命令单独打开和关闭各项变更 藉此 可在最新android
  • 腾讯gpu-manager

    基本原理 vCUDA通过劫持CUDA的显存申请和释放请求 为每个容器管理它的显存使用量 进而实现了显存隔离 唯一需要注意的是申请context并不通过malloc函数 因此无法知道进程在context使用了多少显存 因此vcuda每次都去向
  • cocos creator创建简单的动态网格

    如果初次尝试cocos的动态网格创建 一定会遇到非常多的问题 所以刚开始使用 最好用一个简单的东西来实现 逐步的复杂化 下面代码展示了一个最基础的三角面的创建 代码 private initDyMesh const pos new Floa
  • 记导入第三方库Alamofire的坑

    按照网上打的操作步骤导入之后 存在No Such Module Alamofire 解决办法是重新Build 但是根本没用 原因是版本问题 选择一个合适的版本即可 在readme 文件可看到对应的版本情况
  • 人体姿态估计--RMPE: Regional Multi-Person Pose Estimation

    RMPE Regional Multi Person Pose Estimation ICCV2017 Code is based Caffe and Torch https github com MVIG SJTU RMPE https