Convolutional Pose Machine - 卷积姿态网络

2023-10-27

Convolutional Pose Machine - 卷积姿态网络

论文主要解决 单人单目 RGB图像姿态估计问题。本篇论文也是现在非常火热的openpose开源项目的核心之一，这篇来自CMU的论文为单人姿态估计方面研究注入新的思路。论文网址 Convolutional Pose Machine 大家可以下载原文。

Convolutional Pose Machine - 卷积姿态网络

1.网络结构

首先我们来看网络的具体结构，正如如下两图所示。

论文中描述的网络结构

实现版本的网络结构

本文的Feature Extractor是采用VGG-19到conv4-2的网络结构（具体训练应该是使用imagenet训练好的参数finetune）。同时有一个并列的FeatureExtractor’ 作为stage>=2的输入。

接下来是CPM的多stage结构。我们可以看到，为了快速放大感受野，CPM使用了3个11*11的大核串联的结构，并用两个1*1核作为网络收尾。这里类似FC的设计，但是因为保持FCN的结构，所以使用了1*1conv，最后一个1*1conv输出joint数目+1个Heatmap。其中一个是空响应的背景layer。每个stage的输出都是需要与gt进行比较并计算组成 $Loss_{total}$ 。

2.论文思路

2.1姿态估计

本篇文章的主要贡献是利用卷积神经网络的方法从单目RGB图像中内隐地利用图像的feature与图像相关的空间模型学习了人体姿态。而这种方法不需要任何显式先验。

首先作者提出，通过实验得出，人体姿态估计问题 需要使用其他肢体部分的提示 。作者指出如果想要利用好这些肢体点的提示，就需要 扩大卷积网络的感受野 。扩大感受野的方法就是使用大kernel多stride+pooling的方法，快速获得更大感受野。那么这里我们为什么需要multistage呢？我认为 在网络中如果想要利用好身体肢体点之间相互关系，就要

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器视觉

openpose

神经网络

深度学习

计算机视觉

Convolutional Pose Machine - 卷积姿态网络的相关文章

Maven覆盖私服上的jar包，本地仓库无法更新的问题

在上传第三方jar包到私服环境时第一次上传成功后突然发现上传的jar包有问题但是因为已经指定了版本号并且是release版本的jar包因为不想更换版本号所以再重复上传正确的jar包就会出现如下错误一种解决办法是指定另外一个版
Gitflow工作流程

在工作场合实施Git的时候有很多种工作流程可供选择此时反而会让你手足无措本文罗列了企业团队最常用的一些Git工作流程包括Centralized Workflow Feature Branch Workflow Gitflow Wor
Container命令ctr,crictl的用法

Container命令ctr crictl的用法版本 ctr containerd io 1 4 3 containerd 相比于docker 多了namespace概念每个image和container 都会在各自的namespace

随机推荐

通过Vue.js的axios请求WFS数据并处理请求回来的XML文件

前端小白的第一个博客前言这个是在GIS开发过程中遇到的一个小问题因为里面包含了蛮多的知识点故将其记录废话不多说进入正文正文此次需要解决的问题是通过wfs接口来获取到一些需要的内容然后以这些内容为基础进行一系列的操作以下展示
1.3远程控制及文件传输

我们经常用的是Windows操作系统又经常需要与Ubuntu进行文件传输同时为了能在Windows上操作我们的Ubuntu 这里推荐一个文件传输和一个远程控制的程序文件传输WinSCP 官方下载地址 https sourceforge
VsCode官网快速下载

VsCode官网以Win10下载为例问题描述下载时发现速度很慢甚至会没有下载速度如下图解决方法右键复制这个下载链接将其前半部分修改为vscode cdn azure cn 例如原下载链接 https az764295 v
Codeforces 600C Make Palindrome 【贪心找字典序最小回文串】

一题目概述 C Make Palindrome time limit per test 2 seconds memory limit per test 256 megabytes input standard input
如何在Anaconda安装opencv，下面分享一下教程

1 首先下载opencv安装包下载地址 https download csdn net download qq 42375391 12333992 2 安装完成后在Anaconda Prompt内使用pip install完整路径文件名
算法：模拟思想算法

文章目录实现原理算法思路典型例题替换所有问号提莫攻击 N字型变换外观序列总结本篇总结的是模拟算法实现原理模拟算法的实现原理很简单就是依据题意实现题意的目的即可考察的是你能不能实现题目题意的代码能力算法思路没有很明
openwrt 自动签到插件-食用指南

目录 openwrt 自动签到插件下载 openwrt 插件安装需要的依赖 openwrt 插件安装文件上传 openwrt 自动签到配置设置详情 Cookie获取失败解决方法 Charles 抓包获取Cookie openwrt 配
计算机设备问题代码43,双击unknown device由于该设备有问题Windows已将其停止(代码 43)怎么办解决教程...

金士顿U盘做的启动盘 8G 在别人的电脑上储存文件正常但在自己的电脑上无法识别在设备管理器中显示黄色叹号属性显示该设备存在问题 windows已将其停止代码43 本机win7系统别人电脑为XP系统已将禁用注册表 dos设
Linux 阻塞IO（等待队列）原理及架构

一阻塞操作阻塞操作是指在执行折本操作时若不能获得自愿则挂起进程直到满足可操作性的条件后在进行操作被挂起的进程进入休眠状态被从调度器的运行队列移走直到等待的条件被满足假设recvfrom函数是一个系统调用阻塞不是低效率如果
vue -- 验证码
25-python函数（低阶）

一函数的作用函数的本质就是将一段具有独立功能的代码块整合到一个整体并命名在需要的时候通过调用函数名完成某种需求以提高代码的利用率从而在稳定系统的同时减轻程序员的工作二函数的使用过程函数使用分为两个步骤先定义后调用定义函
Java设计模式之状态模式

本文继续介绍23种设计模式系列之策略模式何时使用 State模式在实际使用中比较多适合状态的切换因为我们经常会使用If else if else 进行状态切换如果针对状态的这样判断切换反复出现我们就要联想到是否可以采取Stat
Android相机-架构3

目录引言 1 Android相机的整体架构 2 相机 HAL 2 1 AIDL相机HAL 2 2 相机 HAL3 功能 3 HAL子系统 3 1 请求 3 2 HAL和相机子系统 3 2 1 相机的管道 3 2 2 使用 Android
TCP的拥塞控制（详解）

在某段时间若对网络中某一资源的需求超过了该资源所能提供的可用部分网络性能就要变坏这种情况就叫做网络拥塞在计算机网络中数位链路容量即带宽交换结点中的缓存和处理机等都是网络的资源若出现拥塞而不进行控制整个网络的吞吐量将随输入负
【6 GoldenEye渗透笔记】

1 前言本文仅用于技术讨论与研究不做任何导向对于所有笔记中复现的这些终端服务器或者实验环境均为自行搭建的公开靶场请勿在现实环境中模仿操作本文涉及到的工具仅就用到的方面做简要描述如果想了解更详细的信息请自行参阅其他技术资料
Java的多态性

Java的多态性多态性严格来讲有两种描述形式一方法的多态性 1 方法的重载同一个方法名称会根据传入参数的类型及个数不同执行不同的方法体 2 方法的覆写同一个方法名称会根据子类的不同实现不同的功能二对象的多态性指的是发生在
51Nod 2094 前缀和

题目链接 https www 51nod com Challenge Problem html problemId 2094 include
unity3D简答题2

游戏对象运动的本质游戏对象运动的本质是对象Transform属性的变化 position决定位置 rotation决定旋转角度请用三种方法以上方法实现物体的抛物线运动如修改Transform属性使用向量Vector3的方法第一
canvas drawbitmap不出现_用Flutter做桌上弹球？聊聊绘图（Canvas&CustomPaint）API

本文是Flutter中Canvas和CustomPaint API的使用实例首先看一下列出最终目标在程序运行后显示一个小球每次程序启动后小球的样式均发生随机性变化体现在大小颜色和位置三点小球运行的规律参考桌球或三维弹球游戏
Convolutional Pose Machine - 卷积姿态网络

Convolutional Pose Machine 卷积姿态网络论文主要解决单人单目 RGB图像姿态估计问题本篇论文也是现在非常火热的openpose开源项目的核心之一这篇来自CMU的论文为单人姿态估计方面研究注入新的思路论文网

热门标签