TensorFlow2.X结合OpenCV 实现手势识别

2023-11-14

TensorFlow2.X结合OpenCV 实现手势识别

使用Tensorflow 构建卷积神经网络，训练手势识别模型，使用opencv DNN 模块加载模型实时手势识别
效果如下：

在这里插入图片描述
先显示下部分数据集图片（0到9的表示，感觉很怪）

构建模型进行训练
数据集地址

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,layers,optimizers,Sequential,metrics
from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2
import os 
import pathlib
import random
import matplotlib.pyplot as plt

os.environ['TF_CPP_MIN_LOG_LEVEL']='2'



def read_data(path):
    path_root = pathlib.Path(path)
    # print(path_root)
    # for item in path_root.iterdir():
    #     print(item)
    image_paths = list(path_root.glob('*/*'))
    image_paths = [str(path) for path in image_paths]
    random.shuffle(image_paths)
    image_count = len(image_paths)
    # print(image_count)
    # print(image_paths[:10])

    label_names = sorted(item.name for item in path_root.glob('*/') if item.is_dir())
    # print(label_names)
    label_name_index = dict((name, index) for index, name in enumerate(label_names))
    # print(label_name_index)
    image_labels = [label_name_index[pathlib.Path(path).parent.name] for path in image_paths]
    # print("First 10 labels indices: ", image_labels[:10])
    return image_paths,image_labels,image_count


def preprocess_image(image):
    image = tf.image.decode_jpeg(image, channels=3)
    image = tf.image.resize(image, [100, 100])
    image /= 255.0  # normalize to [0,1] range
    # image = tf.reshape(image,[100*100*3])
    return image

def load_and_preprocess_image(path,label):
    image = tf.io.read_file(path)
    return preprocess_image(image),label

def creat_dataset(image_paths,image_labels,bitch_size):
    db = tf.data.Dataset.from_tensor_slices((image_paths, image_labels))
    dataset = db.map(load_and_preprocess_image).batch(bitch_size)    
    return dataset


def train_model(train_data,test_data):
    #构建模型
    network = keras.Sequential([
            keras.layers.Conv2D(32,kernel_size=[5,5],padding="same",activation=tf.nn.relu),
            keras.layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'),
            keras.layers.Conv2D(64,kernel_size=[3,3],padding="same",activation=tf.nn.relu),
            keras.layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='same'),
            keras.layers.Conv2D(64,kernel_size=[3,3],padding="same",activation=tf.nn.relu),
            keras.layers.Flatten(),
            keras.layers.Dense(512,activation='relu'),
            keras.layers.Dropout(0.5),
            keras.layers.Dense(128,activation='relu'),
            keras.layers.Dense(10)])
    network.build(input_shape=(None,100,100,3))
    network.summary()

    network.compile(optimizer=optimizers.SGD(lr=0.001),
            loss=tf.losses.SparseCategoricalCrossentropy(from_logits=True),
            metrics=['accuracy']
    )
    #模型训练
    network.fit(train_data, epochs = 100,validation_data=test_data,validation_freq=2)  
    network.evaluate(test_data)

    tf.saved_model.save(network,'D:\\code\\PYTHON\\gesture_recognition\\model\\')
    print("保存模型成功")



    # Convert Keras model to ConcreteFunction
    full_model = tf.function(lambda x: network(x))
    full_model = full_model.get_concrete_function(
    tf.TensorSpec(network.inputs[0].shape, network.inputs[0].dtype))

    # Get frozen ConcreteFunction
    frozen_func = convert_variables_to_constants_v2(full_model)
    frozen_func.graph.as_graph_def()

    layers = [op.name for op in frozen_func.graph.get_operations()]
    print("-" * 50)
    print("Frozen model layers: ")
    for layer in layers:
        print(layer)

    print("-" * 50)
    print("Frozen model inputs: ")
    print(frozen_func.inputs)
    print("Frozen model outputs: ")
    print(frozen_func.outputs)

    # Save frozen graph from frozen ConcreteFunction to hard drive
    tf.io.write_graph(graph_or_graph_def=frozen_func.graph,
            logdir="D:\\code\\PYTHON\\gesture_recognition\\model\\frozen_model\\",
            name="frozen_graph.pb",
            as_text=False)
    print("模型转换完成，训练结束")


if  __name__ == "__main__":
    print(tf.__version__)
    train_path = 'D:\\code\\PYTHON\\gesture_recognition\\Dataset'
    test_path = 'D:\\code\\PYTHON\\gesture_recognition\\testdata' 
    image_paths,image_labels,_ = read_data(train_path)
    train_data = creat_dataset(image_paths,image_labels,16)
    image_paths,image_labels,_ = read_data(test_path)
    test_data = creat_dataset(image_paths,image_labels,16)
    train_model(train_data,test_data)

OpenCV加载模型，实时检测
这里为了简化检测使用了ROI。

import cv2
from cv2 import dnn
import numpy as np
print(cv2.__version__)
class_name = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
net = dnn.readNetFromTensorflow('D:\\code\\PYTHON\\gesture_recognition\\model\\frozen_model\\frozen_graph.pb')
cap = cv2.VideoCapture(0)
i = 0
while True:
    _,frame= cap.read() 
    src_image = frame
    cv2.rectangle(src_image, (300, 100),(600, 400), (0, 255, 0), 1, 4)
    frame = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
    pic = frame[100:400,300:600]
    cv2.imshow("pic1", pic)
    # print(pic.shape)
    pic = cv2.resize(pic,(100,100))
    blob = cv2.dnn.blobFromImage(pic,     
                             scalefactor=1.0/225.,
                             size=(100, 100),
                             mean=(0, 0, 0),
                             swapRB=False,
                             crop=False)
    # blob = np.transpose(blob, (0,2,3,1))                         
    net.setInput(blob)
    out = net.forward()
    out = out.flatten()

    classId = np.argmax(out)
    # print("classId",classId)
    print("预测结果为：",class_name[classId])
    src_image =	cv2.putText(src_image,str(classId),(300,100), cv2.FONT_HERSHEY_SIMPLEX, 2,(0,0,255),2,4)
    # cv.putText(img, text, org, fontFace, fontScale, fontcolor, thickness, lineType)
    cv2.imshow("pic",src_image)
    if cv2.waitKey(10) == ord('0'):
        break

小结

这里本质上还是一个图像分类任务。而且，样本数量较少。优化的时候需要做数据增强，还需要防止过拟合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MLampDL

opencv

python

神经网络

深度学习

TensorFlow2.X结合OpenCV 实现手势识别的相关文章

有没有一种方法可以将python对象直接存储在mongoDB中而不需要序列化它们

我在某处读到过您可以使用 BSON 将 python 对象更具体地说是字典作为二进制文件存储在 MongoDB 中但是现在我找不到任何与此相关的文档有人知道具体如何做到这一点吗没有办法在不序列化的情况下将对象存储在文件数据库
numpy python 中的“AttributeError：'matrix'对象没有属性'strftime'”错误

我有一个维度为 72000 1 的矩阵该矩阵涉及时间戳我想使用 strftime 如下所示 strftime d m y 为了得到像这样的输出 11 03 02 我有这样一个矩阵 M np matrix timestamps 我使用了
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
为什么我应该使用 WSGI？

使用 mod python 一段时间了我读了越来越多关于 WSGI 有多好的文章但没有真正理解为什么那么我为什么要切换到它呢有什么好处这很难吗学习曲线值得吗为了用 Python 开发复杂的 Web 应用程序您可能会使用更全面
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

前端常见难点面试题

1 跨域同源策略同源策略同源策略是浏览器的一个安全功能不同源的客户端脚本在没有明确授权的情况下不能读写对方资源同源就是协议域名和端口号相同降域 document domain 同源策略认为域和子域属于不同的域如 chil
《代码走查》杂记

代码走查一定义 1 代码走查 code walkthrough 是一个开发人员与架构师集中与讨论代码的过程代码走查的目的交换有关代码是如何书写的思路并建立一个对代码的标准集体阐述在代码走查的过程中开发人员都应该有机会向其他人来阐
OpenGL: 视图矩阵的推导

OpenGL 视图矩阵的推导 2014年03月04日 11 08 45 阅读数 6525 把物体从世界坐标系转化到视点坐标系的矩阵称为视图矩阵下面我们先看下opengl视图矩阵的推导过程假设视点或camera的局部坐标系为UVN UVN
webpack中的代码分离

Tip 本指南继续沿用起步中的示例代码请确保你已熟悉这些指南中提供的示例以及输出管理章节代码分离是 webpack 中最引人注目的特性之一此特性能够把代码分离到不同的 bundle 中然后可以按需加载或并行加载这些文件代码分离
Python 九九乘法表的7种实现方式

Python 九九乘法表的7种实现方式九九乘法表是初学者学习编程的必要练手题目之一因此各种语言都有对应的实现方式而 Python 也不例外在 Python 中我们可以使用多种方式来生成一个简单的九九乘法表实现方式一双重循环 f
远程debug java_远程Debug Java进程的方法

远程debug的意思是启动一个Java进程启动一个debugger进程将两者连接起来利用debugger来debug Java进程事实上目前所有的IDE的debug功能都是通过远程debug方式来实现的它们都利用了一个叫做JDPA
【行人重识别】Unsupervised Salience Learning for Person Re-identification

Abstract 人眼可以基于一些较小的显着区域来识别人的身份然而当使用现有方法计算图像的相似度时通常会隐藏这种有价值的显着信息此外许多现有的方法学习区别性特征并以监督的方式处理急剧的视点变化并要求为不同的摄像机视图对标注新的
QSqlQueryModle使用过滤器来完成数据库数据筛选

原型 void QSqlTableModel setFilter const QString filter 注意如果模型已从数据库中填充数据则模型将其与新滤波器重新选择否则将在调用下一次select 中应用过滤器 model的sel
15.服务数据的定义与使用

学习视频 https www bilibili com video BV1zt411G7Vn p 15 目标服务数据的自定义客户端发布显示个人信息的请求服务端处理请求及反馈应答一自定义服务数据 1 定义srv文件 mkdir ca
Python 判断None的三种方法

1 if x is None 2 if not x 3 if not x is None 在Python 中 None False 空字符串空列表空元组其实都相当于False 如果x为空列表 y为None 如果你做x is None的
社区版pycharm官网下载安装教程

1 官网下载安装包官网地址 https www jetbrains com pycharm 选择所需版本 2 安装安装前确认已完成python软件安装建议不要安装到C盘路径不要出现中文直接install 等待安装 3 配置点击桌
PyQt中的多线程使用方法（以PySide6为例）

在Qt中开启多线程的方法有多种总体分成QThread QObject QRunnable QtConcurrent三大类方法而放到PyQt和PySide具体的使用中使用方法可以说十分类似一继承QThread类及run方法此方法
while it seems to fit format ‘yyyy-MM-dd‘T‘HH:mm:ss.SSSX‘

一报错信息如下 2023 04 11 18 52 47 534 WARN 21608 nio 9090 exec 1 w s m s DefaultHandlerExceptionResolver Resolved org springf
浅析CV下的无人驾驶技术

报告题目浅析CV下的无人驾驶技术 1 概述 2006年 Geoffrey Hinton老爷子针对传统的神经网络算法训练速度慢面对多层Hidden Layer严重出现过拟合的现状提出了无监督预训练对权值进行初始化有监督训练微调的解决方
三国群英传霸业之王服务器维护,《三国群英传2网络版》掌上助手APP曝光，三国群英传霸业之王...

列位从公能否还为本人错过逛戏勾当而感应懊末路能否曾身正在外但始末心系三国又能否苦于只能侃侃而谈却无法展现本人的宏图霸业为了让大师可以或许随时随地查看逛戏情况领会逛戏资讯我们将正在逛戏上线后推出掌上帮手列位从公能否还为本人错过逛
【C/C++】日常学习7

1 输入输出流操作 2 构造函数参数参数列表初始化 3 C 中类的前向声明以及和 include的区别 4 在函数后加const的意义 1 输入输出流操作读取字符串的不同操作 cin 遇到空格回车符就停止读取空格回车符是分隔符
❓“想要创业项目，但又不知道互联网上有哪些好的项目？”

想创业但不知道从哪里入手 5大互联网创业项目一起来了解一下吧在互联网时代创业项目不再局限于传统的实体店铺下面介绍的是互联网创业项目希望可以给想要创业的你提供一些启示 1 电商平台电商平台是最为常见的互联网创业项目可以选择开设
实现Vue高德地图多边形编辑器吸附功能

前言之前做的高德地图多边形编辑器吸附功能最近出现不能编辑在修改的过程中顺便记录一下实现效果安装 npm i amap amap jsapi loader save 核心代码
windows7 搭建 Spark 详细图解

第一步下载Spark exe 可执行程序程序的下载地址 http www igniterealtime org downloads index jsp openfire 如果遇到spark 无法正在安装的情况可以参考该文章安装Spa
TensorFlow2.X结合OpenCV 实现手势识别

TensorFlow2 X结合OpenCV 实现手势识别使用Tensorflow 构建卷积神经网络训练手势识别模型使用opencv DNN 模块加载模型实时手势识别效果如下先显示下部分数据集图片 0到9的表示感觉很怪构建模型进

TensorFlow2.X结合OpenCV 实现手势识别

TensorFlow2.X结合OpenCV 实现手势识别

小结

TensorFlow2.X结合OpenCV 实现手势识别 的相关文章

随机推荐

热门标签

TensorFlow2.X结合OpenCV 实现手势识别的相关文章