基于yolov5的物流托盘实时检测方法研究

2023-11-10

摘要

       传统物流作业主要依靠人工操作叉车对托盘进行搬运,自动化程度低。工厂实际环境复杂多样,导致现有的托盘检测算法的模型复杂,耗时较长,无法同时达到准确性和实时性要求,难以实际运用。针对浙江某机械(搬运)设备有限公司下属的电动车工业园实际工厂环境下,XP3托盘自动搬运机器人工作效率问题,提出了一种高效准确的托盘检测算法,该算法利用改进的YOLOv5s网络检测托盘,在托盘定位部分准确率达到了99.8%,定位仅耗时10ms,同时算法的总体正确率达到了98.9%,总体耗时仅54ms,实现了对托盘高效精确的检测。

      关键词:托盘识别、目标检测、yolov5s、深度学习;

 引言

        随着工业4.0的提出,工厂自动化已经成为了一个非常重要的趋势。在物流行业中,自动叉车可以快速的进行物料和部件的运输,因此对托盘自动识别系统的研究能提高工厂生产效率,减轻工人工作强度,降低运输成本,提升工厂自动化水平,具有极大的研究意义。

        目前,自动叉车存在的主要问题是对托盘的识别与检测,因为在复杂的工厂环境中很难精确定位托盘的位置。现在对于托盘的检测,主要有两类方法:基于图像的方法和基于传感器的方法。基于图像方法是使用摄像机捕获托盘图像,然后基于某些托盘特征分离托盘和背景[1,2,3,4,5]。如Garibotto等[5]提出了一种基于模型的视觉算法来检测托盘,但是这种方法没有搜索所有图像的机制,因此无法检测多个托盘。Chen等[1],Cui等[2]和崔光照等[6]使用颜色特征和几何外观来检测托盘。该方法使用形态学、Soble边缘检测和Hough变化来定义边缘和角点,并使用离线训练和在线检测。但是,使用颜色信息作为阈值来区分不同的颜色托盘和背景是不可行的,因为在真实的工厂环境之中颜色信息是复杂的。基于传感器的方法使用射频识别标签[7]、激光传感器[8,9]和无线传感器[10]来检测和定位托盘。

        近年来,随着深度学习理论的不断发展和计算机硬件水平的提高,深度学习算法在速度、精度上达到了非常出色的水准。因此出现许多使用深度学习方法对托盘进行识别与检测的研究。刘江玉等[11]建立Faster RCNN模型对仓储环境中托盘进行检测,Jia-Liang Syu等[12]提出利用单目视觉系统检测托盘,Ryosuke Iinuma等[13]基于深度学习检测出托盘同时使用水平三维光探测测距对托盘与叉车之间的位姿与距离进行测量,这几种算法模型参数多,计算量大,速度很慢,且最终托盘识别的准确率较低。武文汉[14]等提出使用视觉标签识别托盘,此算法虽准确率较高,但前期准备工作量较大,且模型计算量大,速度很慢。因此,设计一种整体检测精度高,速度快的算法成为了亟待解决的问题。

        本文针对这个问题以及根据浙江某力机械(搬运)设备有限公司现有搬运机器人使用的Kinect深度摄像机和对托盘位置及位姿数据需求,提出了一种快速准确的托盘检测算法,对YOLOv5[15]网络进行改进,在保证检测精度的前提下,提升整体检测速度。

1 托盘检测算法

        

 1.1 算法整体框架

        本文提出的方法,通过安装在浙江某机械(搬运)设备有限公司XP3自动机器人的车头底部两边处的两个深度摄像机,拍摄托盘,其算法框架包含三个模块,第一个模块,托盘快速定位模块。该模块利用YOLOv5网络对托盘进行快速定位,并从原始尺度的图片中截取托盘区域。第二个模块,托盘插孔截面识别模块。该模块通过模块一得到的定位信息,从截取的托盘区域图片中识别并截取托盘插孔截面。第三个模块,插孔截面上边缘检测模块。该模块通过模块二得到的定位信息,通过图像处理从插孔截面图片上检测及拟合插孔上边缘。算法整体流程如图1所示。

1.2 托盘快速定位模块

如何在不牺牲检测精度的同时,利用轻量化模型进行实时检测是本课题的一个研究重点。因此本文采用了YOLOv5的YOLOv5s版本对托盘区域进行定位,其网络结构如图2所示。

图2 YOLOV5s网络结构    下载原图

本文沿用YOLOV5算法中的自适应锚框算法,该算法对原始图像自适应的添加最少的黑边,以减少图像高度上两端的黑边,减少算法计算量,目标检测速度提升37%。每次训练时,自适应的计算不同训练集中的最佳锚框值。YOLOV5s初始设定的锚框如表1所示。

  

表1 YOLOV5s初始anchor  下载原图

最终得到的托盘区域定位结果如图3所示。

1.3 托盘插孔截面识别模块

搬运机器人自动叉取托盘需要计算出托盘的三维位置和方向,确定距离机器人最近的托盘插孔截面。在托盘快速定位模块中,对识别出的托盘进行图片截取,在此托盘插孔截面识别模块中,对截取的托盘图片进行插孔截面的识别检测。

托盘插孔截面识别模块使用YOLOv5的YOLOv5s的改进网络,由于托盘截面尺寸在截取出的托盘区域中,比例较大,因此本文在YOLOv5算法的输入端删除Mosaic数据增强分支,以减少网络参数并提高计算速度。

最终得到的托盘插孔截面区域定位结果如图4所示。

1.4 托盘插孔截面上边缘检测模块

在上一模块确定出离机器人最近的托盘插孔截面,为了在深度图中读取并计算托盘的三维位置和方向信息,须确定托盘插孔截面上边缘左右端点和中点的像素坐标值,因此在此模块中检测插孔截面上边缘线,具体步骤如下。

1)图像高斯滤波处理[16]。托盘插孔截面上边缘候选区域确定后,图像中仍然包含许多噪声,噪声的存在显然会使得后续的图像处理操作变得更为复杂。为了既能滤除图像中的噪声又能保持图像当中有用信息不发生变化,通过高斯滤波处理可以平滑图像并过滤部分噪声或者其它可能影响的部分区域,减少候选区域和提高检测速度,使得托盘边缘更为突出,为之后的托盘插孔截面上边缘的提取做充分的准备。高斯函数如下:

2)Canny边缘提取[17]。高斯滤波处理图像后,采用Canny算子提取图像的边缘,以获得托盘插孔截面的轮廓。Canny方法不容易受噪声的干扰,能够检测到真正的弱边缘。其原理是使用Sobel算子计算图像中每个像素点的梯度强度和方向,计算公式如式(2)~式(4)所示;应用非极大值(NonMaximum Suppression)抑制,以消除边缘检测带来的杂散响应;应用双阈值(Double-Threshold)检测来确定真实的和潜在的边缘;通过抑制孤立的弱边缘最终完成边缘检测。

Canny边缘提取图像如图6所示。

图6 Canny边缘提取结果    下载原图

3)提取托盘插孔截面上边缘。Canny边缘提取后使用Hough变换检测直线会检测到很多的直线,为了检测托盘插孔截面的上边缘,其他的直线应当首先被剔除。为此采用如下的滤波:搜索图像的每一列像素点,只保留其中Y值最大的像素,并将其像素值增强,去除其他的像素。托盘边缘提取如图7所示。

图7 托盘边缘提取结果    下载原图

4)二项式拟合直线。使用Hough变换检测直线会检测出不连续的几段直线,因而采用二项式拟合,将保留的像素点依据坐标拟合为一条直线,并提取两端坐标。拟合直线如图8所示。

图8 上边缘拟合直线结果    下载原图

当托盘插孔截面上边缘已经在图像中检测到,为获得托盘的位姿和距离信息,可以根据拟合直线的端点图像坐标,采用深度摄像机建立起来的图像坐标系和实际三维坐标系之间的转换关系,从所拍摄的图像当中计算出拟合直线中点的坐标,以及托盘插孔截面和摄像机平面之间的夹角。

2 实验结果与分析

2.1 实验设置与评价指标

本文使用的数据集来自浙江某机械(搬运)设备有限公司及其下属电动车工业园,利用安装在XP3自动搬运机器人的车头底部两边处的两个深度摄像机,在多个厂房环境下拍摄多种托盘图片,数据集包括3060张分辨率为1024*768的图片,其中蓝色托盘包括有1500张,木制托盘有1560张。数据集划分为训练集2754张,测试集306张。实验所使用的计算机配置:CPU为Intel Core i5-10500,GPU为Nvidia GeForce RTX 2070 SUPER 8G,内存32G,系统为Windows10。训练参数设置如表2所示。

  

表2 训练参数设置  下载原图

2.2 实验结果

评价指标。在托盘定位结果中,对于正样本,当检出的托盘区域(P)与标注的Ground Truth(G)的交并比(IoU)大于0.8时视为一次正确的预测,称之为:True Positive(TP),准确率(A)表示,正确预测的数量与总数量(N)的比值,交并比和正确率计算公式如式(5)、式(6)所示:

本文与刘江玉等[11]建立Faster RCNN模型托盘检测算法,Jia-Liang Syu等[12]提出的利用单目视觉系统,结合自适应结构特征(ASF)和方向加权重叠(DWO)比率建立的托盘检测算法,Ryosuke Iinuma等[13]提出的深度学习模型,武文汉[14]等提出使用视觉标签的模型以及深度学习中常用的几种模型进行比较,对比结果如表3所示。本文所提出的方法在检测正确率达到99.8%,同时所消耗的平均时间仅为10ms。本文提出的算法与速度最快的FasterR(VGG16)相比,速度提升了6倍,并且准确率提高了7.6%;文献[14]提出的算法虽然准确率与本文算法相当,但本文的算法速度比其提升了40倍。

  

表3 托盘定位测试结果对比  下载原图

在托盘插孔截面识别检测模块,对蓝色托盘和木制托盘进行检测所得到的结果如表3所示。P表示准确率,R表示召回率,mAP表示平均精度。

  

表3 托盘插孔截面检测模块测试结果  下载原图

在插孔截面上边缘检测模块,对托盘插孔面的上边缘线进行提取,拟合直线与图片实际边缘线平均误差小于4个像素点,采用深度摄像机计算距离值,误差小于5cm,可以满足托盘检测的要求。

对于该系统的总体检测结果,总体正确率表示系统对测试集中原始图片做出正确预测的结果在测试集中的占比。总体漏检率表示,对测试集中原本出现托盘却判断没有托盘的错误预测在数据集中的占比。总体错检测率表示,对没有托盘的测试图片却预测出托盘,以及对有托盘的测试图片中的托盘截面做出错误预测的结果在测试集中的占比,测试结果如表4所示。

  

3 结语

本文提出了一种高效准确的托盘检测算法,首先利用改进的YOLOv5s网络对托盘进行快速定位,然后从截取的托盘区域图片中识别并截取托盘插孔截面,最后通过图像处理来检测及拟合插孔上边缘。实验结果表明,该算法总体正确率达到了98.9%,且平均总体耗时仅为54ms,能够高效准确地检测托盘。

毕设论文dai写(v):18595224382

参考文献

[1] Chen G, Peng R, Wang Z, Zhao W(2012)Pallet recognition and localization method for vision guided forklift.International Conference on Wireless Communications,Networking and Mobile Computing, pp. 1–4H. C. Lui, C. M.Lee, and F. Gao, Neural networks application to container number recognition[C]//Proceedings of the IEEE 14th Annual International Computer Software and Applications Conference,1990:190-195.

[2] Cui G, Lu L, He Z, Yao L, Yang C, Huang B, Hu Z(2010)A robust autonomous mobile forklift pallet recognition.International Asia Conference on Informatics in Control, Automation and Robotics,286-290.

[3] Garibotto G, Masciangelo S, Ilic M, Bassino P(1996)ROBOLIFT:a vision guided autonomous fork-lift for pallet handling. IEEE/RSJ Int. Conf. on Robots and Systems,656-663.

[4] Pagès J, ArmanguéX, Salvi J, Freixenet J, MartíJ(2001)A computer vision system for autonomous forklift vehicles in industrial environments. Mediterranean Conf. on Control and Automation,379-384.

[5] Seelinger M, Yoder JD(2005)Automatic pallet engagement by a vision guided forklift. IEEE International Conference on Robotics and Automation,4068-4073.

[6] 崔光照,陆琳莎,贺振东,等.基于视觉自主移动叉车货盘识别方法研究[J].郑州轻工业学院学报(自然科学版),2010,25(1):46-49,64.

[7] Jeon S, Choi M, Kim G, Hong B(2010)Localization of pallets based on passive RFID tags. International Conference on Information Technology:New Generations,834-839.

[8] He Z, Wang X, Liu J, Sun J, Cui G(2010)Featureto-feature based laser scan matching for pallet recognition. International Conference on Measuring Technology and Mechatronics Automation,260-263.

[9] Lecking D, Wulf O, Wagner B(2006)Variable pallet pick-up for automatic guided vehicles in industrial environments. IEEE Conference on Emerging Technologies and Factory Automation,1169-1174.

[10] Shen J, Tan H, Wang J, Wang J, Lee S(2015)A novel routing protocol providing good transmission reliability in underwater sensor networks. J Internet Technol16(1):171-178.

[11] 刘江玉,李天剑.基于深度学习的仓储托盘检测算法研究[J].北京信息科技大学学报(自然科学版),2017,32(2):78-84,94.

[12] Jia-Liang Syu, Hsin-Ting Li, Jen-Shiun Chiang, ChihHsien Hsia(2017)A computer vision assisted system for autonomous forklift vehicles in real factory environment. Multimed Tools Appl(2017)76:18387-18407.

[13] Ryosuke Iinuma, Yusuke Kojima, Hiroyuki Onoyama,Takanori Fukao, Shingo Hattori. Pallet Handling System with an Autonomous Forklift for Outdoor Fields. Journal of Robotics and Mechatronics 2020,32(5).

[14] 武文汉.基于视觉的仓储托盘检测方法研究[D].上海交通大学,2018.

[15] Jocher, G, Nishimura, K, Mineeva, T, Vilarino, R:YOLOv5(2020).https://github.com/ultralytics/yolov5.Accessed 10 July 2020.

[16] 李健,丁小奇,陈光,等.基于改进高斯滤波算法的叶片图像去噪方法[J].南方农业学报,2019,50(6):1385-1391.

[17] CESAR B M, LEONARDO F V, LUIS C D. Improved Canny edge detector using principal curvatures[J].Journal of Electrical and Electronic Engineering,2020,8(4):109-116.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于yolov5的物流托盘实时检测方法研究 的相关文章

随机推荐

  • 备份技术

    备份技术 备份技术是灾难恢复技术的一个基础 没有使用备份技术进行全面 及时以及准确的备份 就无法进行灾难恢复 1 备份策略 备份策略的制定是备份系统的一个重要部分 备份策略的选择依赖于数据的重要性 允许备份的可用时间以及其他的一些因素 一般
  • 序列化与反序列化(1)Serializable —— Java原生态方法

    摘自 序列化与反序列化 1 Serializable Java原生态方法 作者 丶PURSUING 发布时间 2021 05 08 19 20 21 网址 https blog csdn net weixin 44742824 articl
  • windows11安装docker时,修改默认安装到C盘

    1 修改默认安装到C盘 2 如果之前安装过docker 请删除如下目录 C Program Files Docker 3 在D盘新建目录 D Program Files Docker 4 win r 以管理员权限运行cmd 5 在cmd中执
  • MySQL权限详解

    本文为joshua317原创文章 转载请注明 转载自joshua317博客 https www joshua317 com article 55 MySQL提供了哪些权限 MySQL提供的权限列表如图所示 其中 All或者Allprivil
  • 一步一步学区块链(1)概念了解

    区块链是分布式数据存储 点对点传输 共识机制 加密算法等计算机技术的 新型应用模式 所谓共识机制是区块链系统中实现不同节点之间建立信任 获取权益的数学算法 含义 比特币 BitCoin 的概念最初由中本聪在2009年提出 根据中本聪的思路设
  • PageHelper中的RowBounds

    RowBounds是处理ResultSet结果集进行分页 也就是说是mybatis默认实现是逻辑分页 并不是物理分页 但PageHelper将这个类利用起来进行了物理分页 PageHelper的其中一种使用方式就是将RowBounds参数获
  • DRM驱动代码分析:色彩管理

    高通PQ有哪些子模块 DSPP sub blocks SDE DSPP IGC DSPP Inverse gamma correction block SDE DSPP PCC Panel color correction block SD
  • Linux Ubuntu安装多个cuda版本

    因为pytorch版本与cuda版本有一定的对应要求 服务器上的cuda是不能自己随便动的 所以需要在自己账户中安装其他版本的cuda 而不能影响其他账户中已安装的cuda 这里参考了多篇博文总结出以下要点 1 nvcc和nvidia sm
  • 攻防世界 shrine 详解

    打开题目 整理源码 代码审计 目标 config FLAG 过滤了 config self 这两个函数的过滤没看懂 总之好像也没过滤掉 应该是过滤了后面的变量 圆括号是彻底的被过滤掉了 URL编码都没用 刚开始想测试XSS来着 做完后 拿编
  • JS数组过滤 简单------->多条件筛选

    在前端部分完成筛选功能 一次拿到所有数据 然后根据条件筛选 通常情况下筛选是后台给接口 在数据量不大的情况下 也有人可能会遇到前端筛选这样的情况 这个是例子中的被筛选数组 var aim name Anne age 23 gender fe
  • 最强大脑(9-10)

    目录 第九季 团队冲击赛 乾坤魔方 运Q帷幄 光影残卷 光柱霓虹 六宫数局 双面拼图 索玛秘图 康斯迭代 第九季 淘汰赛 慧眼识金 连杆曲线 光点密钥 希尔伯特旋涡 移星掠形 星阵潜袭 明灯谜局 彩虹雪花 光图谜笼 战旗阵地 时间旅人 数字
  • [开发] 认证的几种方式简介

    LDAP 认证 LDAP 轻量级目录访问协议 是一种用于访问和维护分布式目录信息的开放标准协议 它最初由电子数据系统公司 Netscape 开发 现在被广泛用于企业和组织中的身份认证和授权管理 LDAP的目标是为不同类型的应用程序 如电子邮
  • 创作灵感打卡

    打卡 打卡 打卡 重要的事情说三遍 作为一个CSDN新手 目标就是 坚持下来 每日分享关于C语言知识 希望在CSDN平台上可以走的更远 今日刚刚发布几篇博客 兴趣大发 希望同僚可以给以鼓励 使得坚持下来
  • RPNet 分割

    46m https github com ooooverflow BiSeNet 网络好像比较大 无模型 https github com superlxt RPNet Pytorch solov2 还未开源 yolact map不到30
  • VS Code 配置C/C++环境 出现问题 could not find the task 'g++' / 'gcc'

    前言 由于新电脑未装VSCode C C 配置环境 刚好手头有些东西想在上面验证 于是开启安装之旅 耗时大概4h 最后还是拷了旧电脑的配置 修改过后才解决的问题 如果你是被标题 骗 进来的 请直接跳转到tasks json部分 推荐先序阅读
  • csu 1803 2016 2016湖南省赛 A

    Problem acm csu edu cn csuoj problemset problem pid 1803 vjudge net contest 161962 problem A Reference www cnblogs com w
  • Day【3】设计一个支持增量功能的栈

    原题链接 文章目录 思路 代码 用数组来模拟栈 思路 题目中已经确切的告诉了我们 数组中会放入多少个元素 这种情况并且只有添加操作 这种情况之下 使用数组模拟效率会更高一点 代码 用数组模拟栈 击败100 class CustomStack
  • 多链生态中的跨链桥是如何运行的?

    在以太坊升级之前 它网络拥堵 手续费高昂等问题逐渐难以满足人们的需求 因此 市场中出现了许多以太坊之外的公链 其中甚至不乏有一些号称 以太坊杀手 项目 尽管以太坊很快反应过来了 并开始对其自身进行升级优化 但一个多链的生态已然形成 在多链态
  • 牛客网 之 数列还原(数列的全排列算法)

    题目描述 牛牛的作业薄上有一个长度为 n 的排列 A 这个排列包含了从1到n的n个数 但是因为一些原因 其中有一些位置 不超过 10 个 看不清了 但是牛牛记得这个数列顺序对的数量是 k 顺序对是指满足 i lt j 且 A i lt A
  • 基于yolov5的物流托盘实时检测方法研究

    摘要 传统物流作业主要依靠人工操作叉车对托盘进行搬运 自动化程度低 工厂实际环境复杂多样 导致现有的托盘检测算法的模型复杂 耗时较长 无法同时达到准确性和实时性要求 难以实际运用 针对浙江某机械 搬运 设备有限公司下属的电动车工业园实际工厂