基于卷积神经网络的人脸表情识别综述

2023-11-18

                  基于卷积神经网络的人脸表情识别

摘要:在日常的沟通与交流过程中,运用面部表情可以促使沟通交流变得更加顺畅,因此对于人类而言,进行面部表情的解读也是进行相关沟通交流内容获取的重要程序。随着科学技术的不断发展,人工智能在日常人类交流沟通中,运用的越发广泛,因此面部表情人工智能识别这一项技术的发展与创新也更加受到关注。本文将对卷积神经网络的人脸表情识别技术进行深入的研究与探析。

关键词:卷积神经网络;人脸表情识别;技术研究

引言:人脸表情识别技术其实是一种将计算机技术与生物学联系在一起的技术。这项技术的出现与创新,标志着人类未来的生活将会出现多种多样的交叉型学科研究,这也意味着人类未来的计算机技术发展,会有更多的可能性,但需要注意的是,想要使得人脸表情识别技术变得更加智能化,更加精准,仍然需要进行更加贴合实际人类需求趋向的技术改进,下文将从卷积神经网络的角度出发,来进行人脸表情识别技术的研究。

一、相关理论概述

想要对基于卷积神经网络的人脸表情识别进行深入的研究与探讨,就需要对神经网络理论以及人脸表情识别技术有一个更加深入的认知。

1.神经网络模型

所谓的神经网络理论中,神经网络模型是较为重要的组成部分,该模型能够对人脑的结构以及功能进行一个数据化的模拟反应。而神经网络中最基本的单位是神经元,因此要进行神经网络模型的构建,必须要对神经元的信息传递方式以及连接方式有一个深刻的认知。相关技术研究人员发现,使用神经网络训练的过程中要进行前向传播以及反向传播的训练。相关技术研究人员通过对人体神经网络日常信息反馈和分析的方式与方法研究,来进行数字化模拟的神经网络模型搭建。

2.卷积神经网络

卷积神经网络是人工神经网络的重要组成部分,它是一种十分高效的网络,需要通过多层的神经网络组合起来才能够进行运用。卷积神经网络有较为漫长的发展历史,随着人工智能技术的逐渐发展和创新,卷积神经网络的技术也逐渐达到了新的高度。在传统的神经网络工作原理中,仅仅只能够满足两层神经元之间的相互连接,但是在日常的计算机运算过程中,全链接层上的参数过多,因此这种传统神经网络的工作方式可能会导致整体的网络训练速度变得十分缓慢,甚至出现过拟合问题。而卷积神经网络则完美的规避了这些缺点,能够使得全链接层上的参数在计算机运行过程中有明显的减少,这样一来整个网络训练的速度就能够得到提升与稳定。在使用卷积神经网络进行图像认知识别的过程中,每个神经元只需要对图像的局部特征进行辨识,而不需要每个神经元都对整个图像的特征进行辨识,这不仅能够使得图像识别的精准程度得到提升,还能够使得图像识别的速度得到提升。因此相比较传统的神经网络在人脸表情识别方面的使用,卷积神经网络的使用会变得更加方便、快捷。
3.人脸表情识别理论

想要成功的进行人脸表情识别,要经历三个阶段,第1个阶段是人脸检测阶段,第2个阶段是人脸表情特征的提取阶段,第3个阶段是人脸表情的识别阶段。这三个阶段缺一不可,共同完成一次人脸表情的精准识别。所谓的人脸检测指的是在图像中精准的,找出人脸的位置,因此不论是第二步骤还是第三步骤的应用,都需要经历第一步骤,如果相关神经网络技术的应用,无法在图像中进行人脸位置的准确提取,那么第二步骤与第三步骤也就无从谈起。能够用来进行人脸检测的方式有很多,这里不进行一一的举例。在第一步骤完成之后,到了第二阶段,就需要进行人脸表情的特征提取,所谓人脸表情的特征,指的是面部肌肉以及纹理变化的相关特征数据化,通过数据化的呈现来进行准确的提取和分析。由于相关人脸表情识别技术不仅仅要运用在静态图像上,也需要运用到动态图像上。而运用到静态图像上的技术与运用到动态图像上的技术有些微的差别,因此相关技术人员必须要对不同的图像类型的人脸表情特征提取进行不同的基础研究。到了第3个步骤之后,由于已经有了提取出的人脸表情特征信息,因此该步骤只需要判断提取出来的特征属于哪一类别,便算是完成了整体的人脸表情识别。这一步骤的完成也可以通过好几种不同的算法来进行。总而言之,人脸表情识别方式以技术手段仍然有不断改进的可能,在卷积网络神经技术使用基础上进行人脸识别技术的使用,更能够保证其准确性。

二、相关网络结构研究
在卷积神经网络模型的使用过程中最常使用到的模型种类是AlexNet,这种卷积神经网络模型相比较传统的卷积神经网络模型,有十分重大的改进。具体而言,在传统的网络训练过程中,通常指使用一个GPU来帮助进行网络训练,这个时候的网络训练速度并不尽如人意。但在AlexNet这一卷积神经网络模型中,相关技术研究人员将GPU拓展到两个以上,这样一来,网络训练的速度就能够获得极大的提升。再者,在传统的卷积神经网络模型中,通常只有7层网络层数。一旦遇到较为复杂的运算就很可能会出现梯度弥散的状况,但如果将网络层数拓展到11层,那么相关的梯度弥散状况发生概率就会获得明显的降低。AlexNet网络结构的使用,就成功将网络层数拓展到了11层。使得相关网络结构更符合人类的使用期待。此外在这一类型的卷积神经网络模型搭建过程中,相关技术研究人员为了对反馈小的神经元进行抑制,使得反馈较为明显的神经元能够获得增强,相关技术研究人员还尝试添加了LRN层,帮助进行局部神经元的竞争机制创建,这样一来模型的泛化能力也得到了较为明显的提升。最后,由于传统的卷积神经网络在使用过程中很可能会出现过拟合情况,为了使得相关弊端能够得到较为精准的规避,相关技术研究人员开始尝试使用大数据量的imagenet机制来对过拟合情况进行控制。因此相比较传统的卷积神经网络模型而言,AlexNet的确更具优势。

三、进行数据库集建立

为了使得未来的人脸精准识别能够变得更加高效准确,有许多技术研究人员开始通过数据库的建立来进行人脸表情的搜索与整理。现有的人脸表情数据库在数据存储量上并不符合使用军机神经网络来帮助进行高效表情识别的期待,因此为了使得研究变得更加精准合理,应当建立能够使用卷积神经网络技术来进行人脸表情识别研究的人脸表情图像数据集。下文将对数据库集的建立进行深入的分析与研究。

1.进行原始数据的获取

想要使得相关人脸精准识别数据库更具典型性与代表性,在相关数据的收集过程中,就应当以认真负责的态度来确保相关数据的真实性。具体到人脸精准识别数据库的建立上,则表现为相关技术研究人员需要对人脸最具代表性的5大类表情:面无表情和微笑哭泣,惊讶,以及生气进行最为精准性的收集。其中微笑表情的面部特征是面部肌肉强有力的收缩,面颊向上,眼角下的皮肤略微有些松弛,眼角的鱼尾纹会起皱。而哭泣表情则是嘴巴张大,整个面部表情向下,眼睛紧闭或是上下眼皮靠拢。而到了生气这一表情的受气过程中,相关技术人员所需要进行关注的面部特征是眼睛睁大,瞳孔变小,以及上下牙齿咬合在一起。而所谓的面无表情就是从表情分析上看不出人类想要表达的情绪。惊讶表情则是,嘴唇张大,眼睛张大,瞳孔放大,都有这一类表情特征的图片则会被标记为惊讶。当然技术研究在进行相关面部图像表情采集的过程中,所需要运用到的采集技术有两种一种是爬虫采集,另一种是手动采集。手工采集是一种较为原始和传统的信息采集方式需要靠技术人员在互联网上进行手动的信息获取。而爬虫采集则颇为不同,爬虫采集只需要使用互联网爬虫技术并可以自动进行图像获取。
因此相比较手动采集而言,爬虫采集更符合现代化的网络信息技术发展趋向。较为常见的爬虫采集技术,可以分为网络链接爬取和图像数据爬取两种。在进行人脸表情数据库建立过程中所需要使用到的爬虫技术是图像数据爬取。能够准确无误的使用该技术,便可以更加真实的进行相关人员数据的获取和整理,这对进行相应数据库的建立是能够起到助力的。

2.进行数据预处理

倘若相关人脸表情识别的数据收集较为真实且高质量,要么在进行下一步的相应人脸表情数据识别过程中,相关识别效率就能够得到有效的提升。因此在进行数据库的建立过程中,进行人脸表情识别准确性的提升是很有必要的。需要注意的是,相关数据库中所收集的图像必须要是正面且无任何遮挡的人脸表情图像,相关技术研究人员倘若在进行图像收集时没有注意到这一特征,很可能会使得整个人脸表情数据库的建立质量受到影响。除此之外,在进行相应原始数据仓库之前,还需要对多余的背景信息进行剔除。因此在进行了相关图像信息的初步采集后,进行数据的预处理工作是十分有必要的。在数据的预处理工作完成后,还要炖,已经处理过的数据信息进行统一的尺寸修改以及格式修改和命名修改,通常情况下,人脸表情数据信息采集在进行了预处理过程后,都需要统一为JPG格式,并且相关的分辨率,也需要进行统一,通常情况下分辨率需要统一为227×27的模式,能够被当作原始的参照图像资料存入库中。在这一流程完毕后,相关的数据库建立便宣告完成。

四、进行AlexNet网络改进
虽然相比较传统的卷积神经网络模型而言,AlexNet具有无可比拟的优势,并且能够使得相关的人脸表情识别效率质量大大提升,但是在人工智能技术不断发展与改进的过程中,相关技术人员仍然发现AlexNet网络结构存在着一定的缺陷。例如使用该网络结构来对人脸表情进行识别实验,最终的精准程度是74.91%。就是说它能够识别大部分的人类面部表情,但却仍然存在误差,这意味着相关网络结构在卷积操作的特征提取过程中,所使用的卷积操作卷积核尺寸并不具备多样性。只想要在未来的卷积神经网络基础上进行人类面部表情识别,并且使得相关面部表情识别变得更加精准和高质量,就需要对现阶段所使用的AlexNet网络结构进行进一步的改进与完善。

结束语
总而言之,在人工智能技术不断发展与完善的过程中,想要使用卷积神经网络来进行而且面部表情的识别与抓取,并且使得相关识别质量与速率能够得到明显的改进,就需要不断结合人工智能技术的发展趋向来进行相关识别技术的完善,这项技术的改进,能够对人类的面部表情进行更好地解读,这样也会在一定程度上促进人与人之间的良好沟通,使得人类日常的生活和工作变得更加方便快捷。

参考文献:
[1]石翠萍,谭聪,左江,赵可新.基于改进AlexNet卷积神经网络的人脸表情识别[J].电讯技术,2020,60(09):1005-1012.
[2]郭昕刚,王帅,张培栋,梁锦明.连接卷积神经网络人脸表情识别算法[J].长春工业大学学报,2020,41(04):381-386.
[3]杨瀚霆. 基于轻量化卷积神经网络的人脸表情识别方法[D].北京建筑大学,2020.
[4]周涛. 基于卷积神经网络的静态图像人脸表情分类技术研究[D].内蒙古科技大学,2020.
[5]王帅. 基于卷积神经网络的人脸表情识别研究[D].长春工业大学,2020.
[6]辛阳阳. 基于深度学习的人脸表情识别方法的研究[D].山西大学,2020.
[7]冀聪聪. 基于卷积神经网络人脸表情识别的研究[D].广西师范大学,2020.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于卷积神经网络的人脸表情识别综述 的相关文章

  • VimFoundation

    模式 vim 分为两种模式 1 命令模式 2 编辑模式 命令模式 i 进入编辑模式 w 保存 q 退出 强制 syntax on 打开语法高亮 set number 显示行号 cc 剪切当前行 pp 粘贴到当前行 u 撤销3武器3 yy 复

随机推荐

  • 开源大模型资料总结

    基本只关注开源大模型资料 非开源就不关注了 意义也不大 基座大模型 LLaMA 7 13 33 65B 1 4T token LLaMA及其子孙模型概述 知乎 GLM 6 130B ChatGLM基座 GLM General Languag
  • C++基础知识 - stack容器

    stack容器 stack是堆栈容器 是一种 先进后出 的容器 stack是基于deque容器而实现的容器 include lt stack gt stack对象的默认构造 stack采用模板类实现 stack对象的默认构造形式 stack
  • 金三银四必备,全面总结 Kotlin 面试知识点

    作者 彭旭锐 前言 在 Android 面试中很重视基础知识的考察 其中语言基础主要包括 Java Kotlin C C 三种编程语言 在小彭面试的经验中 发现很多同学的 Kotlin 语言能力只是停留在一些非常入门的语法使用上 在这篇文章
  • 如何让ChatGPT写情书(三步走)

    近年来 人工智能技术的迅猛发展给我们生活带来了许多便利和惊喜 而动人的情书文学也逐渐成为ChatGPT技术的应用领域之一 ChatGPT模型是一种递归神经网络 可以在大量数据的基础上为用户生成语言内容 使用GPT来写情书 相比以前的纯手工撰
  • python详细安装教程(配置环境变量)

    python安装教程 配置环境变量 人生苦短 我用python 直接在官网下载安装包 msi文件进行安装 https www python org downloads windows 下载python 注意 浏览器左下角下载 点击后 会自动
  • conda和pip 安装python依赖包区别和使用技巧

    引言 Conda 作为一种跨平台的包和虚拟环境管理器 使用的时候功能与pip类似 安装python依赖包的时候经常将两种方法混合使用 但一直没有进行具体区分其差别 重新安装python依赖包的时候出现各种不兼容的bug 经历一天烦躁的安装
  • 你不知道的 script 标签的 defer 与 async 属性

    我持续组织了近一年的源码共读活动 感兴趣的可以 点此扫码加我微信 ruochuan12 参与 每周大家一起学习200行左右的源码 共同进步 同时极力推荐订阅我写的 学习源码整体架构系列 包含20余篇源码文章 历史面试系列 另外 目前建有江西
  • 4G路由器设置

    总共分四步如下图所示 1 用网线连接电脑 2 给路由器上电 3 设置电脑网络 如图打开电脑网络和共享数据中心选中本地连接双击 弹出如下图所示弹框选择图中ipv4双击 根据下面图片配置ip地址 4 浏览器上输入地址访问路由器进行配置 第一步
  • CV 经典主干网络 (Backbone) 系列: CSP-Darknet53

    CSP Darknet53 0 引言 1 网络结构图 1 1 输入部分 1 2 CSP部分结构 1 3 输出部分 2 代码实现 2 1 代码整体实现 2 2 代码各个阶段实现 3 代码测试 4 结论 0 引言 CSP Darknet53无论
  • Halcon实战记录之二《判断两个直线或者矩形是否相交》

    项目中使用到需要判断两个矩形是否相交 由于我使用Halcon不久 对其算子还不熟悉 不知道是否有现成的算子可以直接实现 如果有 还请各位朋友给留言指出 先谢谢了 我这里用了如下的方法 1 如果两个矩形相交 那么它们中的线段一定会有相交的 我
  • LeetCode 687. 最长同值路径

    题目链接 https leetcode cn problems longest univalue path C 代码如下 Definition for a binary tree node struct TreeNode int val T
  • 优惠券的设计分享

    优惠券是一种常见的促销手段 在形式上给予消费者心理一定的折扣 然后促成订单 本文主要分享关于优惠券的设计 一 引子 促销活动的目的按对象可分为对用户 对产品 对公司 其中对用户的促销目的又可分为三种 拉新 促活 留存 优惠券作为一种常见的促
  • 前端基础知识与常见面试题(九)

    描述 现有n种砝码 重量互不相等 分别为 m1 m2 m3 mn 每种砝码对应的数量为 x1 x2 x3 xn 现在要用这些砝码去称物体的重量 放在同一侧 问能称出多少种不同的重量 注 称重重量包括 0 输入描述 对于每组测试数据 第一行
  • 逆向某联盟RSA登录

    目录 1 抓包分析 2 逆向 1 抓包分析 经典抓包套路 发现载荷password的参数进行了加密 还是如此之长 那就可以猜测是RSA加密了 点击启动器 找到login位置 然后搜索password 发现果然是RSA加密 人家还贴切的给了注
  • 零基础入门STM32编程——GPIO(五)

    系列教程链接 HAL库编程点灯篇https blog csdn net oHaoEr article details 122999523 一 GPIO简介 1 1 概述 GPIO 通用输入输出端口 即芯片的IO管脚 STM32F103系列中
  • 深度学习训练之optimizer优化器(BGD、SGD、MBGD、SGDM、NAG、AdaGrad、AdaDelta、Adam)的最全系统详解

    文章目录 1 BGD 批量梯度下降 2 SGD 随机梯度下降 2 1 SGD导致的Zigzag现象 3 MBGD 小批量梯度下降 3 1 BGD SGD MBGD的比较 4 SGDM 5 NAG 6 AdaGrad Adaptive Gra
  • EndNote在word中进行文献引用的插入时,没有出现编号问题

    转载链接 https blog csdn net qq 32120957 article details 83547621 EndNote 是一个著名的参考文献管理软件 用来创建个人参考文献库 并且可以加入文本 图像 表格和方程式等内容及链
  • 网络编程---TCP/UDP套接字编程原理

    本篇介绍的是Linux下的网络编程 故有些接口是不适用于Windows的 但是具体概念和实现方法是大体一致的 本篇重在讲解原理 具体实现请戳这里 gt UDP套接字编程实现 介绍 网络编程套接字 socket 也是进程间通信的一种方式 但是
  • 浅谈Canvas和SVG的区别

    各位都知道canvas是html5提供的新元素 而svg存在的历史要比canvas久远 已经有十几年了 svg并不是html5专有的标签 Canvas和SVG的区别在哪呢 那我们就看看它们的特点 1 SVG SVG可缩放矢量图形 Scala
  • 基于卷积神经网络的人脸表情识别综述

    基于卷积神经网络的人脸表情识别 摘要 在日常的沟通与交流过程中 运用面部表情可以促使沟通交流变得更加顺畅 因此对于人类而言 进行面部表情的解读也是进行相关沟通交流内容获取的重要程序 随着科学技术的不断发展 人工智能在日常人类交流沟通中 运用