【极简笔记】OpenPose

2023-05-16

【极简笔记】Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

论文地址：https://arxiv.org/abs/1611.08050

文章的核心是提出一种利用Part Affinity Fields（PAFs）的自下而上的人体姿态估计算法。研究自下而上算法（得到关键点位置再获得骨架）而不是自上而下算法（先检测人，再回归关键点），是因为后者运算时间会随着图像中人的个数而显著增加，而自下而上所需计算时间基本不变。
PAFs
PAFs是用来描述像素点在骨架中的走向，用L(p)表示；关键点的响应用S(p)表示。先看主体网络结构，网络采用VGG pre-train network作为骨架，有两个分支分别回归L(p)和S(p)。每一个stage算一次loss，之后把L和S以及原始输入concatenate，继续下一个stage的训练。随着迭代次数的增加，S能够一定程度上区分结构的左右。loss用的 $L_2$ 范数，S和L的ground-truth需要从标注的关键点生成，如果某个关键点在标注中有缺失则不计算该点。
网络架构
对于S，每一类关键点有一个channel，生成ground-truth的时候是按照多个高斯分布取max的方法来保留各个点的响应峰值。对于L 则复杂一点，先看准确定义，对于第k个person的第c个肢干上的PAFs：

L∗c,k(p)={v0if p on limb c,kotherwise L c , k ∗ ( p ) = { v if p on limb c,k 0 otherwise

$L^*_{c,k}(p)=\begin{cases}v & \text{if p on limb c,k}\\0 & \text{otherwise}\end{cases}$

v=(xj2,k−xj1,k)/||xj2,k−xj1,k||2 v = ( x j 2 , k − x j 1 , k ) / | | x j 2 , k − x j 1 , k | | 2

$v=(x_{j_2,k}-x_{j_1,k})/||x_{j_2,k}-x_{j_1,k}||_2$

$x_{j,k}$ 表示第k个person第j 个关键点的位置。而像素点p是否落在limb（肢干）则设了一个阈值范围
limb

0≤v⋅(p−xj1,k)≤lc,kand|v⊥⋅(p−xj1,k)|≤σl 0 ≤ v ⋅ ( p − x j 1 , k ) ≤ l c , k and | v ⊥ ⋅ ( p − x j 1 , k ) | ≤ σ l

$0\leq v\cdot (p-x_{j_1,k})\leq l_{c,k} \text{and}|v_{\perp}\cdot(p-x_{j_1,k})|\leq \sigma_l$
其中 lc,k l c , k $l_{c,k}$ 和 σl σ l $\sigma_l$ 分别表示limb长度和宽度。最后也会对所有person相同类别肢干进行平均，使得L的输出的channel与肢干种数相等：

L∗c(p)=1nc(p)∑kL∗c,k(p) L c ∗ ( p ) = 1 n c ( p ) ∑ k L c , k ∗ ( p )

$L_c^*(p)=\frac{1}{n_c(p)}\sum_k L^*_{c,k}(p)$
知道PAFs和关键点位置 dj d j $d_j$ 之后，需要评估这俩关键点的相关性。文章中就是算了一下这两个关键点连线上各像素点PAF向量与连线向量的点积的积分：

E=∫u=1u=0Lc(p(u))⋅dj2−dj1||dj2−dj1||2du E = ∫ u = 0 u = 1 L c ( p ( u ) ) ⋅ d j 2 − d j 1 | | d j 2 − d j 1 | | 2 d u

$E=\int^{u=1}_{u=0} L_c(p(u))\cdot\frac{d_{j_2}-d_{j_1}}{||d_{j_2}-d_{j_1}||_2}du$

p(u)=(1−u)dj1+udj2 p ( u ) = ( 1 − u ) d j 1 + u d j 2

$p(u)=(1-u)d_{j_1}+ud_{j_2}$
在得到关键节点以及边权之后，计算姿态骨架已经完全转化成了一个图问题。文中没有采用全局优化的方法，而是利用匈牙利算法对相邻节点进行了最优匹配（比如一堆左手腕节点和一堆左手肘节点，利用小臂的PAF计算边权，再进行最优匹配），最后获得整个的人形姿态骨架。

实验效果也非常好，主要是速度快。附带代码地址https://github.com/CMU-Perceptual-Computing-Lab/openpose
result

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

openpose

极简笔记

【极简笔记】OpenPose 的相关文章

Opencv将目录下的图片存储为视频

文章目录源码编译运行源码 span class token comment gt File Name main cpp gt Author gt Mail 1 64 163 com gt Created Time 2022年06月17日
机器学习之svm---车牌识别

目标团队承接嵌入式linux软硬件开发机器视觉图像处理网络流等项目微信号 xff1a hgz1173136060本文档尝试解答如下问题如何使用OpenCV函数 CvSVM train 训练一个SVM分类器 xff0c 以及用
I2C调试工具

1 I2C调试工具 i2c tools工具是开源I2C调试工具 xff0c 具有获取I2C总线挂载的设备列表及设备地址 xff0c 可对指定设备指定寄存器进行读写的功能 ubuntu安装 xff1a apt get install libi
Ubuntu18版本安装ROS

最近不小心把虚拟机里的ROS弄坏了 xff0c 导致Linux都无法使用也忘了快照导致所以软件重新安装 xff0c 在这里给大家分享一下ubuntu18版本如何安装ros以及我安装中出现的问题如何进行解决注 xff1a 不同的ubunt
ZED相机快速使用指南

1 安装SDK ZED SDK 3 8 Download Stereolabs 2 安装ros GitHub stereolabs zed ros wrapper ROS wrapper for the ZED SDK 其他教程 xff1a
vscode：前进后退快捷键

1 xff09 后退 xff1a alt 43 2 xff09 前进 xff1a alt 43
git: tag 和 branch 的区别

前言 tag 是什么 tag 翻译过来是标签的意思 xff0c 顾名思义 xff0c 标签是为了标记某种事物 tag 是 Git 版本库的一个快照 xff0c 指向某个 commit 的指针 tag 的好处 tag 的存在 xff0c 是因
QApplication a(argc,argv);崩溃

Microsoft Visual C 43 43 Debug Library Debug Error Program de mytoolkit mytoolkit mytoolkit Win32 Debug mytoolkit exe Mo
jetson Xavier nx安装torch和torchvision，并解决解决版本不匹配（报错RuntimeError: Couldn‘t load custom C++ ops）的问题

目录 1 安装torch 2 安装torchvision 3 验证是否安装成功 4 错误记录 5 torch和torchvision网盘链接首先 xff0c torch和torchvision都不能直接pip安装 xff0c 以下的演示是
C++ 数据结构：DS顺序表--合并操作

题目描述建立顺序表的类 xff0c 属性包括 xff1a 数组实际长度最大长度 xff08 设定为1000 xff09 已知两个递增序列 xff0c 把两个序列的数据合并到顺序表中 xff0c 并使得顺序表的数据递增有序输入第1行

随机推荐

ubuntu安装多个版本python

背景 xff1a 本地环境 Ubuntu 22 04 64 bit xff0c 默认安装python3 10 6 xff0c 未安装pip venv 需求 xff1a 安装python3 8 xff0c 并安装两版本对应pip xff0c
socket编程中recv()和read()的使用与区别

recv和read相似 xff0c 都可用来接收sockfd发送的数据 xff0c 但recv比read多了一个参数 xff0c 也就是第四个参数 xff0c 它可以指定标志来控制如何接收数据 1 recv 原型 xff1a ssize t
stm32printf函数的串口输出代码

stm32f103串口一与串口二printf函数输出因项目需要特意配置了该段代码 xff0c 不喜勿喷 xff0c 纯属个人笔记对于串口的代码网上也是很多 xff0c 无非是配置问题 xff0c 该代码是基于stm32f103c8t6来
C/C++ —— 小端转大端函数的使用

函数说明 uint32 t htonl uint32 t hostlong uint16 t htons uint16 t hostshort uint32 t ntohl uint32 t netlong uint16 t ntohs u
AntDesign Upload组件上传图片

技术选型前端技术选型 xff1a React Hook 43 typescript antd版本 xff1a 3 18 使用Upload上传图片上传效果截图预览效果截图项目中完整写法 xff1a span class token k
[LeetCode] 876. Middle of the Linked List

Given a non empty singly linked list with head node head return a middle node of linked list If there are two middle nod
博客搬家啦

博客搬家啦 xff0c 新博客地址 https blueleek blue 小伙伴一起嗨学一起来
MFC 改变编辑框字体（大小，字体）

1 在 Dlg h文件中加入 CFont font 字体对象 2 定义一个CEdit控件变量 CEdit m EditAa 61 CEdit GetDlgItem IDC A EDIT A 关联控件A CEdit m EditBb 61 C
STM32 中浮点转成字符串，解决 -u_printf_float

开发偶遇问题在C 43 43 或其他高级语言中 xff0c 以及C语言在Visual Studio或者linux平台上 xff0c 是可以直接通过sprintf将 xff0c int float转换成string类型的 xff1b 但是
路由器原理（一）

觉得之前对路由器的了解还不是特别清楚 xff0c 继续来学习 xff0c 是参考了路由器的原理及其配置 xff08 一 xff09 一 xff1a 路由器的基础知识 xff08 1 xff09 路由器的概述 xff1a 作为网络层的网络互连
表单提交及后台数据接收

用POST请求 xff0c 后台原生接收的一个公式 xff1a span class hljs transposed variable req span addListener span class hljs string 34 data
JSON怎样添加注释

今天在写一个程序的时候发现了一个问题 xff0c 在json文件中添加注释之后 xff0c 程序就出现bug了于是 xff0c 去搜了一下这个问题的相关解释 xff0c 在这里和大家分享一下 xff1a JSON为什么不能添加注释 xff
Converting circular structure to JSON

在做手机验证码模块 xff0c 遇到一个bug Converting circular span class hljs keyword structure span span class hljs keyword to span JSON
Mac root和普通用户切换

今日 xff0c 老身在用su 命令 xff0c 输入密码之后准备切换至root用户但不幸得到这个消息 xff1a su Sorry 找到解决方案如下 xff1a span class hljs built in sudo span su
TCP UDP 的区别和具体应用场景

TCP和UDP 两者都是通信协议 xff0c TCP和UDP都是传输层协议 xff0c 但是他们的通信机制和应用场景不同 TCP TCP xff08 Transmission Control Protocol xff09 又叫传输控制协议
浏览器缓存机制详解（一）

浏览器缓存机制可以极大的提升用户体验 xff0c 另一方面会因为读取缓存而展示了错误的东西 xff0c 因而在开发中要设法将其删除什么是浏览器缓存 xff1f 浏览器缓存就是把一个已经请求过的web资源 xff08 如html页面 xff
G2O库和Eigen库can not find 问题——FindG2O.cmake FindEigen3.cmake

目录 CMakeLists设置FindG2O cmake文件内容FindEigen3 cmake 文件内容 CMakeLists设置在CMakeLists里加入如下这句话 xff0c 并在项目文件夹中新建cmake文件夹 LIST APP
sockaddr_in结构体

点击进入结构如下 xff1a struct sockaddr in uint8 t sin len sa family t sin family in port t sin port struct in addr sin addr char
Win7下VS2010使用STLPort .

Win7下VS2010使用STLPort 更新于2012年8月24日星期五 http blog csdn net shunqiziranhao007 article details 7905435 STLport的下载地址 http so
【极简笔记】OpenPose

极简笔记 Realtime Multi Person 2D Pose Estimation using Part Affinity Fields 论文地址 xff1a https arxiv org abs 1611 08050 文章的核心

【极简笔记】OpenPose

【极简笔记】Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

【极简笔记】OpenPose 的相关文章

随机推荐

热门标签