OpenCV手部关键点检测（手势识别）代码示例

2023-05-16

点击我爱计算机视觉标星，更快获取CVML新技术

前几日分享了learnopencv.com博主Satya Mallick发表的关于OpenCV Mask RCNN实例分割的博文（详见：OpenCV4.0 Mask RCNN 实例分割示例 C++/Python实现），展示了OpenCV作为DNN推断工具的简单用法。
昨日Satya Mallick又发表了使用OpenCV调用OpenPose工程中的手部关键点检测（hand pose estimation）模型的文章，对于想要使用手部关键点检测做手势识别、手语识别、抽烟检测等工程开发的朋友来说这是一个非常简单的上手教程。
先来看看作者发布的视频效果：

在大部分情况下还是不错的，但也出现了少数帧关键点跳变的情况。

算法思想
该文中作者使用的算法模型是CMU Perceptual Computing Lab开源的集合人体、人脸、手部关键点检测的开源库OpenPose，其中手部关键点检测（Hand Keypoint detector）算法来自CVPR2017的论文《Hand Keypoint Detection in Single Images using Multiview Bootstrapping》。
人手在3D空间由于视角不同、灵活的精细动作等原因，较难得到精确标注的数据集。在该论文中，作者提出了一种称之为Multiview Bootstrapping的手部关键点检测迭代改进算法，实现了具有较高精度的检测算法。
如上图所示，作者提出首先使用少量标注的含有人手关键点的数据集训练Convolutional Pose Machines神经网络，使用31个不同视角的高清摄像头拍摄人手，用上述检测模型初步检测关键点，将这些关键点根据摄像机的位姿构建三角（triangulation），得到关键点的3D位置，再将计算得到的3D点位置重投影到每一幅不同视角的2D图像，再使用这些2D图像和关键点标注训练检测模型网络，经过几次迭代，即可以得到较为精确的手部关键点检测模型。
原论文中提出的模型可生成22个关键点，其中21个点是人手部的，第22个点代表着背景。下图展示了人手部的21个关键点位置。

OpenCV手部关键点检测主要流程
1）下载模型
运行开源工程中的getModels.sh下载模型，
或者直接在网址：
http://posefs1.perception.cs.cmu.edu/OpenPose/models/hand/pose_iter_102000.caffemodel
下载。将模型放到“hand/”文件夹下。
2）加载模型和图像
使用OpenCV DNN函数readNetFromCaffe函数加载模型权重。
3）推断预测
blobFromImage将图像转为blob,forward函数实现网络推断。
4）获取关键点精确位置并显示

上述网络计算的结果是22个矩阵，每个矩阵代表某个特定关键点最可能出现在图像中哪个位置的热图，需要调用minmaxLoc函数找到精确位置，进而将其画出并标注序号。

5）画出骨架

视频效果：

从视频中可以看出关键点有抖动，且有部分帧出现关键点跳变，如何让其更稳定呢？

在该博文评论区，某大佬提出使用Savgol滤波器对数据进行平滑可以得到较满意的结果。
看看效果如何：

是不是立刻感觉好了很多？

关键点平滑代码：
https://stackoverflow.com/questions/52450681/how-can-i-use-smoothing-techniques-to-remove-jitter-in-pose-estimation/

原博文地址：
https://www.learnopencv.com/hand-keypoint-detection-using-deep-learning-and-opencv/
代码地址：
https://github.com/spmallick/learnopencv/tree/master/HandPose

长按关注我爱计算机视觉

【点赞与转发】就是一种鼓励

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OpenCV手部关键点检测（手势识别）代码示例的相关文章

iphone opencv - 模板匹配

我已经在我的 iphone 项目中实现了这个 OpenCV 构建 http aptogo co uk 2011 09 opencv framework for ios http aptogo co uk 2011 09 opencv fra
将 OpenCV Mat 转换为数组（可能是 NSArray）

我的 C C 技能很生疏 OpenCV 的文档也相当晦涩难懂有没有办法获得cv Mat data属性转换为数组 NSArray 我想将其序列化为 JSON 我知道我可以使用 FileStorage 实用程序转换为 YAML XML 但这不
找到 4 个特定的角像素并将它们与扭曲透视一起使用

我正在使用 OpenCV 我想知道如何构建一个简单版本的透视变换程序我有一张平行四边形的图像它的每个角都由具有特定颜色的像素组成该像素在图像中没有其他位置我想遍历所有像素并找到这 4 个像素然后我想将它们用作新图像中的角点以扭曲
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
OpenCV Python 和 SIFT 功能

我知道有很多关于Python and OpenCV但我没有找到有关这个特殊主题的帮助我想提取SIFT关键点来自 python OpenCV 中的图像我最近安装了 OpenCV 2 3 可以访问 SURF 和 MSER 但不能访问 SIF
将图像加载到现有 Mat 中

有没有办法将图像加载到现有的 Mat 中如果没有有没有办法控制 OpenCV 在调用 cv imread 时分配内存的位置我只是为您的类创建一个构造函数该构造函数接受 imread 的输入参数并将图像直接加载并分配到您的类中所
如何在python 3.8中安装opencv-python

我在 pycharm 中安装 opencv python 时遇到问题打开 pycharm 后我单击设置然后单击项目解释器单击并搜索正确的模块我开始安装但失败了 Could not find a version that s
针对不同处理器架构的 Gradle android 构建

我想使用 Gradle 为 4 个不同的 Android CPU 处理器架构 armeabi armeabi v7a x86 mips 构建 4 个单独的 apk 我有为 4 个 CPU 架构构建的本机 OpenCV 库libs folde
OpenCV 地板分割检测

我正在研究一种检测图像中地板的方法我试图通过将图像缩小为颜色区域然后假设最大区域是地板来实现此目的我们对机器人的运行环境做出一些相当广泛的假设我正在寻找一些关于适合这个问题的算法的建议任何帮助将不胜感激编辑具体来说我正在寻找一
Python 2.7/OpenCV 3.3： cv2.initUn DistorifyMap 中出现错误。不显示不扭曲的校正图像

我想扭曲并校正我的立体图像为此我在 Python 2 7 中使用了 Opencv 3 3 我使用的代码是 import cv2 import numpy as np cameraMatrixL np load mtx left npy
在Spyder(Python 3.6)中导入cv2时出现导入错误

我已经在Windows操作系统中安装了opencv 3 0 0 我已运行该应用程序并已成功将其安装在C 驱动器并还复制了cv2 pyd文件输入C Python27 Lib site packages正如我在几个教程视频中看到的那样在我的
使用 Brew 安装 OpenCV 永远不会完成

所以我尝试使用 Homebrew 安装 opencv 但它不起作用我用了brew tap homebrew science进而brew install opencv发生的情况是 gt Installing opencv from home
OpenCV findContours() 仅返回一个外部轮廓

我试图隔离验证码中的字母我设法过滤验证码结果是这个黑白图像但是当我尝试使用 OpenCV 的 findContours 方法分离字母时它只是发现了一个包裹整个图像的外部轮廓从而产生了该图像图像外部的黑色轮廓我将此代码与 Pyt
在谷歌Colab中使用cv2.imshow()

我正在尝试通过输入视频来对视频进行对象检测 cap cv2 VideoCapture video3 mp4 在处理部分之后我想使用实时对象检测来显示视频 while True ret image np cap read Expand di
OpenCV warpPerspective 性能缓慢

在我的应用程序中我跟踪一个物体到达它的地方corners都在这个框架中我发现它之间的单应性corners从最后一帧开始和当前帧使用单应性来做perspectiveTransform on the corners在当前帧中找到得到
使用 Xcode 为 OS X Lion / Mountain Lion 编译 OpenCV (2.3.1+)

谁能给我提供一些如何使用 Xcode 在 OS X Lion 上编译 OpenCV 2 3 1 的详细指南我对此很生气我得到了源代码使用 cmake 创建 Xcode 模板并尝试构建它但它失败并出现大约 200 个错误提前致谢多
Opencv中内存Mat表示

我知道在内存中opencv将Mat对象表示为一个大数组因此如果我有 3 个尺寸为 200x200 的通道垫那么在内存中它将将该垫存储在尺寸为 3x200x200 的数组中或者更一般地说内存中的任何 Mat 都将存储为channel
Python OpenCV视频格式在浏览器中播放

我正在尝试从一系列图像创建视频并将其显示在浏览器中但由于某些奇怪的原因无论我使用什么编解码器或文件格式我都会收到以下错误找不到格式和 MIME 类型受支持的视频这是我的代码 ready images import cv2 for
如何在 Ubuntu 16.04 上安装适用于 Python 2.7 的 openCV 2.4.13？

我尝试了很多在线帖子来安装 opencv 但它们不适用于 Ubuntu 16 04 有人可以给我安装 openCV 2 4 13 的步骤吗我不久前制作了一个脚本用于安装最新版本的 OpenCV 截至本答案的最后一次更新为 4 2 这是它
如何在 OpenCV 中删除 mouseCallback

在使用 C 的 OpenCV 中有没有办法删除 mouseHandler int event int x int y int flags void param 通过函数添加到窗口 image window cv setMouseCallb

随机推荐

C For Linux之内存访问-内存简介

1 内存 1 1 计算机为什么需要内存存储器是计算机系统中非常重要的组成部分计算机中的存储器分为两类 xff1a 内存储器的外存储器 xff08 也叫辅助存储器 xff09 所谓外存储器在PC机中一般指硬盘 U盘光盘等 xff0c 而
每天一分钟玩转golang：基础类型之字符串（四）

大家好 xff0c 我是加摩斯 xff0c 觉得文章有帮助的小伙伴 xff0c 记得一键三连哟 xff5e 申明 xff1a 本系列两天更新一篇 xff0c 纯原创 xff0c 转载前请与我沟通字符串类型也是一种基本类型 xff0c 底层
项目二：电子骰子

项目二 xff1a 电子骰子文章目录项目二 xff1a 电子骰子一导入 5分钟 xff09 学习目的二新授 65分钟 1 预展示结果 5分钟 2 本节课所用的软硬件 5分钟 3 硬件介绍 1分钟 4 图形化块介绍 1分钟 5 单个
项目三：双人骰子

项目三 xff1a 双人骰子文章目录项目三 xff1a 双人骰子一导入 5分钟 xff09 学习目的二新授 65分钟 1 预展示结果 5分钟 2 本节课所用的软硬件 5分钟 3 硬件介绍 1分钟 4 图形化块介绍 1分钟 5 单个
项目四：无极调光台灯

项目四 xff1a 无极调光台灯文章目录项目四 xff1a 无极调光台灯一导入 5分钟 xff09 学习目的二新授 65分钟 1 预展示结果 5分钟 2 本节课所用的软硬件 5分钟 3 硬件介绍 5分钟 4 图形化块介绍 10分钟
Windows10安装anaconda之后pip3不能使用

1 在命令行中切换到你自己的anaconda环境中 xff0c 2 在命令行中 xff0c 切换到你的anaconda环境中的Scripts目录中像我是在 xff1a D software anaconda3 az envs py3 pyt
UE4蓝图通信-蓝图接口

蓝图接口除了最常用的cast to蓝图节点可以实现通信以外 xff0c 进阶的通信方式就是蓝图接口目的 xff1a 与多个对象中的特定几个对象进行通信方式 xff1a 对检测到的对象发送消息消息 xff1a 发出的消息是接口消息 xff
UE4蓝图通信-事件分发器(Event Dispatcher)

事件分发器在蓝图编辑器的我的蓝图选项卡中创建在我的蓝图 xff08 My Blueprint xff09 面板中的进行创建输入事件分发器的名称 xff0c 该字段显示在我的蓝图 xff08 My Blueprint xff09 选项卡
UE4项目优化(帧数优化)相关知识

控制台命令 r screenpercentage 0 100 0是百分之百如果改了这个游戏运行超级流畅说明瓶颈在GPU上stat fps 显示帧率 Frame Per Second 或者快捷键Crlt 43 Shift 43 H 显示帧
计算机图形学【GAMES-101】2、光栅化(反走样、傅里叶变换、卷积)

快速跳转 xff1a 1 矩阵变换原理Transform 旋转位移缩放正交投影透视投影 2 光栅化反走样傅里叶变换卷积 3 着色计算深度缓存着色模型着色频率 4 纹理映射重心坐标插值透视投影矫正双线性插值MipMa
计算机图形学【GAMES-101】10、材质(BRDF)(折射、菲涅尔项、微表面模型、各向异性材质)

快速跳转 xff1a 1 矩阵变换原理Transform 旋转位移缩放正交投影透视投影 2 光栅化反走样傅里叶变换卷积 3 着色计算深度缓存着色模型着色频率 4 纹理映射重心坐标插值透视投影矫正双线性插值MipMa
【重心坐标插值、透视矫正插值】原理以及用法见解(GAMES101深度测试部分讨论)

文章目录 1 Barycentric Coordinates xff08 重心坐标 xff09 1 1 重心坐标概念1 2 重心坐标计算方式1 3 重心坐标插值 2 重心坐标计算公式推导3 透视投影插值矫正3 1 透视矫正后的 96 深度插
gcc之inline函数探究

1 引子 xff1a 内联函数 xff08 以下称为inline函数 xff09 的行为类似于宏 xff0c 但是会像函数一样进行参数的静态类型检查因此gcc中很多地方倾向于使用inline函数来替代宏但是inline函数在gcc中应该
Visual Studio中多个源文件、多个main()函数如何分开运行

对于跟网课的小伙伴 xff0c 有些初学者可能像我以前一样 xff0c 想记录每一课的代码 xff0c 会一节课一个 sln解决方案 xff0c 这样非常不方便如果一个 cpp放一个main函数 xff0c 再F5运行肯定报错咯 xff0
C++中的变参宏 #define MyMacro(...)(__VA_ARGS__)

span class token macro property span class token directive hash span span class token directive keyword define span span
使用premake帮助生成Visual Studio解决方案

Premake xff1a https github com premake premake core Premake 是一个基于 Lua 脚本语言的构建系统工具 xff0c 用于生成项目文件和构建脚本 xff0c 能够帮助开发者快速创建和
Vulkan中renderpass、subpass、dependency的见解

在Vulkan中 xff0c 渲染通道 Render Pass 是一个描述渲染过程中使用的附件的对象 xff0c 可以包含多个 subpass 和附件依赖关系假设我们需要创建一个render pass xff0c 它包含2个附件 1个子通
string和char*互转以及c_str()的陷阱

string类型和char char 的转换 string转const char 1 使用string的成员函数c str 2 使用string的成员函数data 3 注意事项 xff1a c str 和data 的不同之处在于 data
机器人视觉场景理解挑战赛

这是澳大利亚机器人视觉中心发起的一项比赛 xff0c 刚刚开始 xff0c 欢迎做机器人 SLAM 场景理解的朋友参与 1 主要特点 BenchBot xff0c 用于运行语义场景理解算法的完整软件堆栈仅需几行Python代码即可在逼真的
OpenCV手部关键点检测（手势识别）代码示例

点击我爱计算机视觉标星 xff0c 更快获取CVML新技术前几日分享了learnopencv com博主Satya Mallick发表的关于OpenCV Mask RCNN实例分割的博文 xff08 详见 xff1a OpenCV4 0

OpenCV手部关键点检测（手势识别）代码示例

OpenCV手部关键点检测（手势识别）代码示例 的相关文章

随机推荐

热门标签

OpenCV手部关键点检测（手势识别）代码示例的相关文章