LabVIEW结合神经网络在图像目标检测中的应用

2023-11-05

神经网络在图像识别中的应用

摘要:随着大数据时代的快速发展,图像识别技术的重要性与日俱增,大量的数据集和强大的服务器计算能力,更是如虎添翼,相比传统的图像分类方法已经无法满足用户对于对图像分类灵活性和速度上的要求,甚至在复杂环境下,传统算法在进行图像分类识别的时候暴露出高复杂度,低鲁棒性的劣势。基于卷积神经网络( Convolution Neural Network,CNN) 的图像分类方法,冲破了传统图像分类方法的瓶颈,成为目前图像分类的主流算法。本文综合简单介绍传统方法图像的原理,同时重点提出卷积神经网络在图像识别目标检测方向的应用示例,卷积神经网络不仅解决了传统方法的目标检测,同时具备自己的得天独厚的优势,卷积神经网络在图像识别领域一定有广阔的前景,也期待在能广泛应用于传统工业生产制造领域。
关键词: 卷积神经网络 图像识别

Application of CNN in image recognition

Abstract: With the rapid development of big data era, the importance of image recognition technology is increasing day by day. A large number of data sets and powerful server computing power are even more powerful. Compared with the traditional image classification methods, it can not meet the user’s requirements on the flexibility and speed of image classification. Even in complex environment, the traditional algorithm is very popular in image classification and recognition The disadvantages of high complexity and low robustness are revealed. Image classification method based on convolution neural network (CNN) breaks through the bottleneck of traditional image classification methods and becomes the mainstream algorithm of image classification. In this paper, the principle of traditional image method is introduced, and the application example of convolution neural network in image recognition target detection direction is put forward. Convolution neural network not only solves the target detection of traditional method, but also has its own unique advantages. Convolutional neural network will have a broad prospect in the field of image recognition, and it is expected to be widely used in transmission Industrial production and manufacturing.
Key words : CNN ; Image recognition

0 引言
随着通信技术的迅速发展以及智能手机的全面普及,图像识别的技术在日常生活中应用范围不断扩大。医疗诊断、指纹识别以及面部识别等都属于这一应用的典型案例。为保证图像识别能够为智能生活保驾护航,更加准确、迅速的为广大百姓服务,这正是本文讨论的意义所在。卷积神经网络在图像识别中的研究,就是期望能够通过机器学习以及算法的优化,用最快的速度,精准的识别出目标图像。

1 图像识别技术
图像识别的主要流程包括图像预处理、图像特征描述和提取以及分类器的设计。图像识别技术本身的原理并不算太过复杂,信息的处理是这一技术的关键点所在,图像识别技术需要根据自身对图像的记忆完成具体的识别工作,其实这与人眼识别图像本质上是一样的。其最大的难点在于,计算机在识别过程中对于图像特征的提取存在着不稳定性,而恰恰就是这种不稳定性决定了图像识别的准确性以及效率。
传统的图像识别的常用方法有:贝叶斯分类法、模板匹配法、 核方法等。但是在图像识别过程中,这几种方法在提取特征过程中显示出较为滞后以及复杂的劣势,不能满足用户对于高速度,低耗时等高要求。
当下较为主流的图像识别技术是非线性降维的图像识别技术和神经网络的图像识别技术

  1. 非线性降维的图像识别技术:降维,通过单幅图像数据的高维化,将单幅图像转化为高维空间中的数据集合,对其进行非线性降维。寻求其高维数据流形本征结构的一维表示向量,将其作为图像数据的特征表达向量。
    非线性降维的图像识别技术保证了在特征提取过程中可以维持高维空间的结构。保证其外在流形以及内在的结构,对于图像识别的准确性起到至关重要的作用。相较于更传统的线性降维图像识别技术,此方法对于识别不均匀特性的高维图像,降维后更能够提取出更加准备的目标特性
  2. 神经网络图像识别技术,其能够实现图像的识别主要得益于神经网络学习算法的运用,而在应用神经网络进行的图像识别中,我们首先需要对相关图像进行预处理,然后我们还需要针对图像识别的领域与对象完成具体的神经网络设计,最后我们再进行神经网络的训练来保证其较好的满足图像识别需求。
    相较于传统的图像分类方法,神经网络图像识别技术不再需要人工的对目标图像进行特征描述和提取,而 是通过神经网络自主地从训练样本中学习特征,并且这些特征与分类器关系紧密,这很好地解决了人工提取特征和分类器选择的难题。

2 基于卷积神经网络的图像识别

卷积神经网络,其基本组成包括输入层、卷积层、池化层、全连接层。
通过卷积神经网络进行图像分类较之传统的图像分类方法最大的优势在于模拟大脑的视觉处理机制对图像层次化的抽象,自动筛选特征,从而实现对图像个性化的分类任务。这解决了传统图像分类方法中人工提取特征这一难题,真正的实现了智能化。

  • 输入层 :卷积神经网络的输入层可以直接处理多维数据。它的主要任务是读取图像信息,该层的神经元个数与图像的维度紧密相关。
  • 卷积层 : 卷积层在卷积神经网络中用于特征提取。卷积神经网络中的卷积层是由多个卷积单元组成 的,目的就是为了实现卷积操作。
  • 池化层 : 对输入的特征图进行压缩,一方面使特征图变小,简化 网络计算复杂度;一方面进行特征压缩,提取主要特征。
  • 全连接层 : 全连接层可以整合卷积层或者 池化层具有类别区分性的局部信息。全连接层是连接所有特征,将输出值送给分类器
    卷积神经网络图像识别技术,虽然在目前的主流市场展现出绝对的优势,但是其仍然存在一些亟待解决的问题
  • 训练速度的优化
  • 算法优化
  • 网络的层次结构优化
    2传统方式识别图像
    传统方式检测目标图片的一种方法是根据目标的特征及与周边图像的边界差别进行检测,由于图像的特征复杂度直接影响到算法的设计难度,另一种方式就是模板匹配,在检测图片中与模板进行对比,获取匹配度,从而检测目标图片。
    以下简单介绍模板匹配的实现方法,在一个测试图像中识别目标图片并标记出目标图片的位置,如下所示:
    在这里插入图片描述

选择三种检测目标的图片,在右侧图片中进行识别,并识别出目标图片的位置,目标图片参数位置如下所示:
在这里插入图片描述

传统图像识别方式的识别能力目前已经很成熟,能适应大部分的应用场景,但是对环境的稳定性要求较高,比如被检测图片的亮度、目标图片的复杂性、相机的稳定性等。
3卷积神经网络识别图像
3.1 数据源生成
使用两幅图片 在这里插入图片描述
在这里插入图片描述
作为目标检测图片,像素大小为3232,在像素大小为128128的白色背景中,随机生成1000副图像,图像尺寸为128128,数据格式为.png,图片库生成流程如下:
在这里插入图片描述

数据源生成界面如下所示:
在这里插入图片描述

数据源生成
设置Duplicates=2将目标图片重复出现2次,Output Resolution=128将分辨率设置为128*128,No of Images=1000生成1000副图片,Current Image为当前示意图,Average Intensity Distribution为图片库像素强度图,图片库如下:
在这里插入图片描述

生成图片库
生成图片库的同时,生成图像的标签库,与图片一一对应,如下图所示:
在这里插入图片描述

生成图片标签库
在这里插入图片描述

3.2 训练并测试数据源
通过卷积神经网络方法对生成的1000张数据源进行训练和测试,模型拓扑如下所示:
在这里插入图片描述

(一)初始化一个神经网络参数:

  1. 设置Validation Portion=0.1将其中的100张图片作为测试集,900张图片作为训练集;

  2. 设置minibatch size=64(通常设置为128,256,512考虑到计算机内存通常是2的次方),通常都尝试,来看哪个使得损失函数J的下降速度快并且波动小。

  3. 设置NN_Device=CPU(可以设置为GPU)作为算法执行的处理器;
    (二)初始化Conv3D卷积参数设置:

  4. 使用3D卷积神经网络算法进行训练模型,3D卷积原理如下:
    在这里插入图片描述

  5. 设置Filters=16,Kernel_Size=9,Stride =4,Pad_Type=Same,即内核数16,过滤窗口为9回旋步长为4,自动填充卷积维度。
    (三)Region检测参数配置:

  6. 设置classes=2即检测的目标类型为2种,分别是: 和 ;coords=4使用四个坐标作为检测参数,分别是X坐标、Y坐标、宽度、高度;

  7. 设置thresh=0.8即训练模型的阀值为0.8。
    (四)训练参数:

  8. 配置训练优化算法为SGD即随机梯度下降方法,SGD的主要解决的问题是:收敛速度慢和陷入局部最优。

  9. 定义损失函数为CrossEntropy:
    CrossEntropy有三个神经元,三个输入,一个输出,α=σ(z),其中z=∑ j w j x j +b α=σ(z),其中z=∑jwjxj+b如下:
    在这里插入图片描述

CrossEntropy损失函数定义如下:
在这里插入图片描述

把α=σ(z)带入上式:
在这里插入图片描述

CrossEntropy函数的最大好处是:错误大时,更新多,学得快. 错误小时,学习慢
3) 设定学习率参数:Policy_Type=Step,k=10,即每10个周期学习率下降2倍。
4) 模型训练过程:使用900副图像,随机mBatch=32张去训练模型,训练过程为:执行一个优化步骤(小批量采样->正向传播->损耗评估->反向传播->网络更新),并返回当前迭代的评估损失值。
(五)观察模型训练反馈参数:
参数曲线如下所示:
在这里插入图片描述

参数解释如下所示:

序号 参数 训练反馈参数 参数定义

1 Avg_Recall 0.958276 召回率是覆盖面的度量,度量有多个正例被分为正例,recall=TP/(TP+FN)=TP/P=sensitive,可以看到召回率与灵敏度是一样的。
2 Avg_Class 0.966901 平均等级/类别概率。越高越好。
3 Avg_Obj 0.986602 目标度(置信度)TP概率的平均值(此框中存在对象的概率(锚点))。如果检测到的目标和地面真相之间的IOU大于等于0.5,则认为正确检测(真阳性)。越高越好。
4 Avg_IOU 0.788086 预测和地面真实边界框之间的平均IOU(相交于联合)。
5 Avg_NoObj TN. 0.0685122 TN.的平均置信水平越低越好
6 Count 123.784 当前小批量中地面真实对象的数量。
7 Loss 0.0420179 平均损失(误差)。越低越好。

(六)模型测试:
使用已经训练好的模型对100张测试数据进行测试,测试效果如下所示:
在这里插入图片描述

选择测试集中的第19张作为测试对象,如做下图所示,在图中能准确检测出目标图片 和 的位置,并在图片中使用方框标注出来并用颜色进行分类,神经网络算法能计算出目标检测图像的坐标和大小,即X/Y/W/H四个参数,如下所示:

序号 检测目标 匹配度 类别号 目标图片 阈值 结果
1 目标1 0.999171 0 0.6 通过
2 目标2 0.999904 1 0.6 通过
3 目标3 0.999772 0 0.6 通过
4 目标4 0.991084 1 0.6 通过

4 结论
卷积神经网络图像识别技术在日常生活中如今已经发挥着重要的作用,如已经广泛应用于大数据的背景下,容易获取样本的场景下,如统计、预测未来趋势、故障检测等领域,该技术在图像识别中即能获得传统方式的高精度、高效率的特点,同时解决了传统方法的图像识别过程中无法自学习的缺点,使得无需再花费大量时间去调整算法、调整参数,相信在工厂制造领域也能获得更多的应用。相信神经网络的图像识别能突破技术瓶颈,走进生活中方方面面,这将对于我国未来的经济发展和民众的生活质量将带来较为积极的影响。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

LabVIEW结合神经网络在图像目标检测中的应用 的相关文章

随机推荐

  • CSDN博客修改不了头像的最新解决方法

    自己的博客不能改头像 清理缓存 换IE浏览器 都不行 以前有类似经历 可以在手机APP上修改头像 然后自动同步了 下载 CSDN APP 左上角 个人中心 点击 头像 修改就好了 我修改后没立即出来 延迟可能
  • C + + 使用小括号/大括号直接赋值,又叫列表初始化。简介

    C 使用小括号 大括号直接赋值 又叫列表初始化 简介 C 可以使用 小括号 大括号 直接赋值 并且 兼容了 C风格 的等号 赋值 C 使用小括号 大括号直接赋值 又叫列表初始化 简介 C 中 我们可以使用小括号直接赋值的方式 将多个值赋给一
  • Vue中使用动画

    在Vue中使用动画效果 1 使用transition标签包裹需要动画显示的内容 1 1 默认名的方式
  • java并发编程笔记(五)--共享模型之无锁

    1 无锁解决线程安全问题 就是使用CAS 利用乐观锁的不断确认 来保证线程安全 乐观锁时原子系列类的方法 使用的时候需要创建原子系列对象 创建原子整数对象 AtomicInteger balance new AtomicInteger 举个
  • 《重构 改善既有代码的设计 1》重构原则

    前言 重构 既有代码的设计 一本经典神书 两年前入手 一年前看了一半 感觉一般般 今天起 再次拜读 希望会有不一样的收获 startTime 2020 12 16 23 22 endTime 2020 12 16 23 59 startPa
  • 猜你喜欢-----推荐系统原理介绍

    写在正文之前 最近在做推荐系统 在项目组内做了一个分享 今天有些时间 就将逻辑梳理一遍 将ppt内容用文字沉淀下来 便于接下来对推荐系统的进一步研究 推荐系统确实是极度复杂 要走的路还很长 A First Glance 为什么需要推荐系统
  • Error:Cannot build artifact xxx:war exploded‘ because it is included into a circular dependency

    IDEA 项目报错 Error Cannot build artifact xxx war exploded because it is included into a circular dependency 解决 ctrl alt shi
  • unity android 在后台运行_Unity学习—资源管理概览

    本文介绍了 Unity 常用四种默认路径 以及 AssetDataBase Resources AssetBundle 和目前最新的 Addressable 四种资源管理方式 文中所有 API 均以版本 2019 3 为准 本文原地址 Un
  • 使用vue-json-viewer实现高亮展示、折叠和复制json数据

    最近项目上有个需求 就是在前端显示json格式的数据 并且提供展开和收起的按钮 先看一下最终完成的效果吧 在这里我使用了vue json viewer这个组件来实现这个效果 这个组件主要能实现高亮 json折叠和copy功能 能满足项目需求
  • Windows下的Memcache安装

    很多phper不知道如何在Windows下搭建Memcache的开发调试环境 最近个人也在研究Memcache 记录下自己安装搭建的过程 其实我开始研究Memcache的时候并不知道居然还有memcached for Win32这个鸟东西
  • 【Matlab】数据插值

    数据插值 插值与拟合的区别 实现方法 插值要求曲线穿过样本点 而拟合不需要穿过样本点 只要求总体误差最小 结果形式 插值是分段逼近样本点 没有同一的逼近函数 函数拟合则用一个函数去逼近 有完整的表达式 侧重点 插值可以用于估计区间内某些点对
  • java实现webdav服务_访问WebDAV服务

    输入用户名和密码即可登录入服务器 使用类似ftp的命令就可以操作服务器上的文件 使用h命令可列出所有的命令 dav gt hAvailable commands ls cd pwd put get mget mput edit less m
  • LD 浅析 转

    原文地址 http www cnblogs com cjjnjust articles 1617086 html LD 浅析 转 本文乃转载 原作者的E mail是zhanglei sict ac cn 完成于2005 11 5 2005
  • Java之继承与多态

    目录 一 继承 1 为什么需要继承 2 继承概念 3 继承的语法 4 父类成员访问 1 子类中访问父类的成员变量 2 子类中访问父类的成员方法 5 super关键字 6 子类构造方法 7 super和this 8 再谈初始化 9 prote
  • 互联网的两大组成及其特点

    1 互联网由两大部分组成 边缘部分及其核心部分 2 边缘部分 主要由连接在互联网上的主机组成 这部分是直接与用户相连的 在边缘部分主要的活动是两个主机之间的通信 其通信方式可以分为两类 1 客户 服务器方式 就是客户机向服务器请求服务器 客
  • 14 openEuler DNF(YUM)配置管理

    文章目录 14 1 DNF配置文件 14 1 1 配置main部分 14 1 2 配置repository部分 14 1 3 显示当前配置 14 2 创建本地软件源仓库 14 3 添加 启用和禁用软件源 14 3 1 添加软件源 14 3
  • paste0函数在R语言中的应用

    paste0函数在R语言中的应用 在R语言中 paste0函数是一个非常有用的函数 它可以将多个输入组合成一个字符串 这个函数的使用非常简单 只需要将要组合的内容作为参数传递给paste0函数即可 在本文中 我们将通过实例来演示paste0
  • 全球及中国装备制造产业投资战略及产销需求预测报告2021-2027年版

    全球及中国装备制造产业投资战略及产销需求预测报告2021 2027年版 HS HS HS HS HS HS HS HS HS HS HS HS 修订日期 2021年10月 搜索鸿晟信合研究院查看官网更多内容 第一章 装备制造业概述 1 1
  • Redraiment的走法

    题目描述 题目描述 Redraiment是走梅花桩的高手 Redraiment总是起点不限 从前到后 往高的桩子走 但走的步数最多 不知道为什么 你能替Redraiment研究他最多走的步数吗 样例输入 6 2 5 1 5 4 5 样例输出
  • LabVIEW结合神经网络在图像目标检测中的应用

    神经网络在图像识别中的应用 摘要 随着大数据时代的快速发展 图像识别技术的重要性与日俱增 大量的数据集和强大的服务器计算能力 更是如虎添翼 相比传统的图像分类方法已经无法满足用户对于对图像分类灵活性和速度上的要求 甚至在复杂环境下 传统算法