3090单卡+yoloV8+训练手势识别(手把手教学)

2023-11-08

利用yoloV8训练自己的数据集(手势识别数据):
github:官方项目链接
yolo相关发展史介绍:
在这里插入图片描述
YOLO(You Only Look Once)是一种流行的对象检测和图像分割模型,由华盛顿大学的 Joseph Redmon 和 Ali Farhadi 开发。

  • YOLO2015 年推出,以其高速度和准确性迅速受到欢迎。
  • YOLOv22016 年发布,通过结合批量归一化、锚框和维度集群改进了原始模型。
  • YOLOv32018 年推出,使用更高效的主干网络、多个锚点和空间金字塔池进一步增强了模型的性能。
  • YOLOv42020年发布,引入了马赛克数据增强、新的无锚检测头和新的损失函数等创新。
  • YOLOv5进一步提升了模型的性能,并增加了超参数优化、集成实验跟踪和自动导出为流行的导出格式等新功能。
  • YOLOv62022年由美团开源,并在该公司的许多自主送货机器人中使用。
  • YOLOv7添加了额外的任务,例如对 COCO 关键点数据集的姿势估计。
  • YOLOv8是Ultralytics 最新版本的 YOLO。作为尖端的、最先进的 (SOTA) 模型,YOLOv8 建立在先前版本成功的基础上,引入了新功能和改进以增强性能、灵活性和效率。YOLOv8 支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。这种多功能性允许用户在不同的应用程序和领域中利用 YOLOv8 的功能。
    yolov8的详细介绍YOLOv8 深度详解!一文看懂
    --------------------------------分界线----------------------------------
    下面是具体实验记录:

1.数据集准备

手势识别数据集:具体介绍
该数据集包含用于对象检测的 5 个手势类的 839 张图像:1,2,3,4,5. 在五个手指的帮助下,形成一个到五个数字的组合,并在这些带有相应标签的手势上训练对象检测模型,如图 5所示。数据集分为训练集、验证集和测试集。该数据集包含 587 个训练图像、167 个验证图像和 85 个测试图像。每个图像都有一个416× 416只有一个对象(或实例)的分辨率。
在这里插入图片描述
各个类别数据分布如下:在这里插入图片描述数据文件夹结构:
在这里插入图片描述
数据集格式为yolo_txt格式,即将每个xml标注提取bbox信息为txt格式,每个图像对应一个txt文件,文件每一行为一个目标的信息,包括class, x_center, y_center, width, height格式。格式如下:
在这里插入图片描述

2.环境准备

基础环境rtx3090显卡,yolov8要求的基本环境如下:
在这里插入图片描述
创建虚拟环境并激活:

conda create -n xx python=3.8
conda activate xx

拉取yolo的git项目

git clone https://github.com/autogyro/yolo-V8.git
cd yolo-V8
pip install -r requirements.txt
pip install ultralytics

3.测试环境

官网下载相应的权重
在这里插入图片描述
利用下面的测试指令进行测试:

yolo task=detect mode=predict model=yolov8n.pt conf=0.25 source='https://media.roboflow.com/notebooks/examples/dog.jpeg'

在这里插入图片描述
在这里插入图片描述

4.训练自己的数据

创建自己数据集的yaml文件
在这里插入图片描述在yolo-V8目录下运行以下代码(单卡训练)

yolo task=detect mode=train model=yolov8n.pt data=ultral
ytics/yolo/data/datasets/hand.yaml batch=32 epochs=100 imgsz=640 lr0=0.01

在这里插入图片描述
训练过程可视化:
在训练过程的可视化tensorboard tensorboard --logdir ./ 然后打开localhost:6006即可,效果如下:
在这里插入图片描述
训练完可以去result文件夹查看相应的结果:
在这里插入图片描述
如何多卡训练,只需添加gpu(device=0,1)即可

yolo task=detect mode=train model=yolov8n.pt data=ultral
ytics/yolo/data/datasets/hand.yaml batch=32 epochs=100 imgsz=640 lr0=0.01 device=0,1

5.模型测试

在这里插入图片描述
训练完会在train2的目录下生成相应的.pt文件:
在这里插入图片描述
测试图片指令:

yolo task=detect mode=val split=test model=runs/detect/train2/weights/best.pt  data=hand.yaml

在这里插入图片描述
ceshi在这里插入图片描述
测试视频指令:
自己录制一个video进行测试

yolo task=detect mode=predict source=video.mp4  model=runs/detect/train2/weights/best.pt

测试效果还是不错的!
在这里插入图片描述
参考:
1.使用YOLOv8训练自己的目标检测数据集
2.YOLOV8进行疲劳驾驶检测
3.在自定义数据上训练 YOLOv8?
4.YOLOv8训练自定义数据集(超详细)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

3090单卡+yoloV8+训练手势识别(手把手教学) 的相关文章

随机推荐

  • 来了来了,2023年某中大厂真实面经!

    300万字 全网最全大数据学习面试社区等你来 本篇文章的面经是我辅导的一个同学的真实面试经历 2023年校招的宝子们拿走快看 第一个面经来自某头部大厂 1 做过的项目细节和遇到的问题 30分钟 所以说大家要对简历中的项目细节了如指掌 2 实
  • 如何在一个vue项目中集成electron框架

    将electron框架集成到vue文件中 不改变vue文件的原有结构 1 在vue文件中安装electron框架 运行代码 vue add electron builder nde为v16的 electron版本一般选择 electron
  • WSL2 使用桥接网络(不使用代理,局域网可独立IP访问)

    1 一切开始之前首先需要启动 WSL 直接在命令行运行运行 wsl 即可 这样 WSL 的网卡才会被自动创建出来 2 查看 网卡 管理员权限运行 PowerShell 运行 Get NetAdapter获取所有的网卡信息 注意这里的网卡不能
  • Using fork in Perl to spread load to multiple cores

    原文链接 https perlmaven com fork If you have a big task to do that needs a lot of computation but can be split up in severa
  • 【华为OD机试真题 JAVA】素数之积

    JS版 华为OD机试真题 JS 素数之积 标题 素数之积 时间限制 1秒 内存限制 262144K 语言限制 不限 RSA加密算法在网络安全世界中无处不在 它利用了极大整数因数分解的困难度 数据越大 安全系数越高 给定一个32位正整数 请对
  • 熔断机制-HYSTRIX

    一 问题产生 雪崩效应 是一种因服务提供者的不可用导致服务调用者的不可用 并将不可用逐渐放大的过程 正常情况下的服务 某一服务出现异常 拖垮整个服务链路 消耗整个线程队列 造成服务不可用 资源耗尽 形成过程 1 服务提供者不可用 a 硬件故
  • GPT-4掀起智能革命浪潮,AI风口下将涌现哪些新机遇?

    本文已同步发表至公众号 https mp weixin qq com s kTMhMZQ nfIbbeeXLnDeyA 编辑 AGI之心 3 月 15 日 OpenAI 发布 GPT 4 多模态大模型 支持文本和图像输入 相比前段时间大火的
  • AttributeError: ‘Namespace‘ object has no attribute ‘use_pdserving‘

    问题描述 按照文档安装 运行paddleocr的 demo的时候报这个错 AttributeError Namespace object has no attribute use pdserving 但是我用命令行能跑出来 解决办法 在pa
  • openwrt安装和使用minicom

    opkg list先看一下软件源里面有没有minicom包 有的话就直接安装 opkg install minicom 安装完后执行minicom v查看版本信息确认是否安装成功 安装完成后 把USB串口设备插入到路由器USB口 我用的是p
  • 只出现一次的数字python--只求和?(简单到偷懒)

    对于刚开始接触python小白去刷算法题老想偷懒 想看算法 等等大神 还没学会 哈哈哈哈 水一篇 简单到应该不用加备注 嘿嘿嘿 给定一个非空整数数组 除了某个元素只出现一次以外 其余每个元素均出现两次 找出那个只出现了一次的元素 class
  • 防盗报警系统功能简述

    周界防护系统主要是一些探测设备组成 利用现代科技的声 光处理技术 在第一线感知各种破坏 和犯罪行为 减少犯罪的几率 其主要的器材是红外对射探头 红外对射探头全名叫 光束遮断式感应器
  • 简单聊聊MySQL临时表(TEMPORARY TABLE)

    目录什么的也不需要 一 什么是临时表 二 临时表有哪些类型 1 内部临时表 2 外部临时表 三 对外部临时表说两句 四 执行验证 一 什么是临时表 MySQL临时表在很多场景中都会用到 MySQL内部在执行复杂SQL时 需要借助临时表进行分
  • IT项目管理-分析校园人脸识别门禁系统的可行性

    IT项目管理 分析校园人脸识别门禁系统的可行性 文章目录 IT项目管理 分析校园人脸识别门禁系统的可行性 系统描述 分析 业务 组织 技术 总结 系统描述 校园人脸识别门禁系统主要将人脸识别技术应用于校园门禁中 不同于传统刷卡门禁系统 该系
  • 第8章 Linux文件类型及查找命令实践

    第8章 Linux文件类型及查找命令实践 8 1 Linux文件属性概述 在Linux系统中 文件或目录的属性主要包括 索引节点 Inode 文件类型 权限属性 链接数 所归属的用户和用户组 最近修改时间等内容 执行ls lhi命令可以显示
  • STM32/GD32单片机防止程序克隆盗版解决办法

    1 目的 解决产品在市场流通过程中被电路板抄板 程序克隆 以各种手段窃取别人的知识产权 2 解决方案 1 在程序中处理 在程序每次上电运行时 先获取1次芯片唯一ID缓存在int GetID 10 数组中 然后在Flash特定存储区位置读出
  • 史上最强的 QML 思维导图

    作者 一去 二三里 QQ 技术交流群 242790253 个人微信 iwaleon 加我微信 邀请入 500 人微信群 微信公众号 高效程序员 这是一份史上最强 最高清 最好用的 QML 思维导图 所有内容均来自专栏 细说 QML 全新的
  • 紫光展锐驱动之sensorhub调试

    第一章 平台及硬件信息简介 本文档基于ums312 T310 Android 11 sensorhub架构 sensor的硬件接口为i2c1 该平台目前不支持spi 第二章 紫光展锐的移植文档 第三章 sensor厂家提供的代码 代码在共享
  • Java配置环境变量(保姆级)

    1 前提 你必须成功安装jdk 方可配置java环境变量 2 位置 右击此电脑 点击属性 点击高级系统设置 点击环境变量 在系统变量处配置环境变量 3 配置 3 1 配置JAVA HOME 这个需要新建 变量名 JAVA HOME 这里需要
  • 利用Python结构化您的工程

    我们对于 结构化 的定义是您关注于怎样使您的项目最好地满足它的对象性 我们 需要去考虑如何更好地利用Python的特性来创造简洁 高效的代码 在实践层面 结构化 意味着通过编写简洁的代码 并且正如文件系统中文件和目录的组织一样 代码应该使逻
  • 3090单卡+yoloV8+训练手势识别(手把手教学)

    利用yoloV8训练自己的数据集 手势识别数据 github 官方项目链接 yolo相关发展史介绍 YOLO You Only Look Once 是一种流行的对象检测和图像分割模型 由华盛顿大学的 Joseph Redmon 和 Ali