Cascade EF-GAN: 局部聚焦渐进式面部表情编辑

2023-11-03

目前面部表情编辑存在的问题:生成性对抗网络(GAN)的最新进展表明,面部表情编辑有了显著的改进。然而,当前的方法仍然容易在表达密集型区域周围产生伪影和模糊,并且在处理大间隙表达转换(例如从愤怒到大笑的转换)时,经常引入不希望的重叠伪影。

本文提出的方案

(1)为了解决这些局限性,我们提出了Cascade Expression Focal GAN(Cascade EF-GAN),这是一种新的网络,可以使用局部表情焦点进行渐进式面部表情编辑。局部聚焦的引入使Cascade EF-GAN能够更好地保留眼睛、鼻子和嘴巴周围与身份相关的特征和细节,这进一步有助于减少生成的面部图像中的伪影和模糊。

(2)此外,设计了一种创新的级联变换策略,将大型面部表情变换分解为级联中的多个小型表情变换,这有助于抑制重叠伪影,并在处理大间隙表情变换时产生更逼真的编辑效果。

(3)在两个公开的面部表情数据集上进行的大量实验表明,我们提出的级联EF-GAN在面部表情编辑方面取得了优异的性能。

论文题目

Cascade EF-GAN:局部聚焦渐进式面部表情编辑

Introduction

面部表情编辑发展现状

面部表情打开了一扇了解人们内部情绪的窗口,传达了微妙的意图,关于面部表情的自动识别有很多研究工作。在数字媒体的今天和时代,面部表情编辑即将给定面部图像的表情转换为目标表情,而不丢失身份属性,有可能应用于不同的领域,比如说摄影技术、电影产业、娱乐业等。它越来越受到学术界和工业界的关注。

现有的面部表情编辑方法存在的不足

受生成性对抗网络(GANs)最近的成功启发,报告的几项研究工作已经取得了非常令人印象深刻的面部表情编辑结果。另一方面,现有的方法仍然面临一些约束。首先,现有的方法往往会产生不连贯的伪影和/或模糊,尤其是在那些表情丰富的区域,如眼睛、鼻子和嘴巴周围。第二,当源面部表情与目标面部表情存在较大差距时,现有方法往往会产生重叠伪影,例如从愤怒到大笑的转换 。

现有的面部表情编辑方法只将图像作为整体处理,没有特别关注与局部身份相关的特征(眼/鼻子/嘴巴)

面部表情编辑的任务需要维护个人身份。作为人类,识别面部图像的自然方法是特别注意眼睛、鼻子和嘴巴,这主要是因为这些区域包含丰富的身份相关信息。另一方面,几乎所有基于GAN的面部表情编辑方法都只是将输入的面部图像作为一个整体进行处理,而没有特别注意与局部身份相关的特征,这可能是大多数现有方法在眼睛、鼻子和嘴巴周围产生不连贯伪影和模糊的一个主要原因。

基于GANs的面部表情编辑方法都对目标表情执行一步转换

此外,据我们所知,所有现有的基于GANs的面部表情编辑方法都对目标表情执行一步转换。另一方面,由于网络容量的限制,在处理大间隙变换时,单步变换通常会产生重叠伪影(在面部表情变化较大的区域周围)。由于面部表情的变化本质上是连续的,如果网络将其分解为许多小的变换,那么大的间隙变换应该更好地完成。

级联表达局部GAN

在这篇论文中,我们提出了一种新的级联表达局部GAN(级联EF-GAN),用于局部聚焦的渐进式面部表情编辑。级联EF-GAN由级联中几个相同的EF-GAN模块组成,这些模块以渐进的方式执行面部表情编辑。具体而言,设计了一种创新的级联变换策略,将大型面部表情变换分解为多个小型面部表情变换,并循序渐进的执行面部表情变换。这种渐进式面部表情转换有助于抑制重叠伪影,并在处理大间隙面部表情转换时实现更健壮、更逼真的表情编辑。

此外,每个EF-GAN模块都包含许多预定义的局部焦点,分别捕捉眼睛、鼻子和嘴巴周围与身份相关的特征。EF-GAN具有与身份相关的详细特征,能够生成具有更少伪影的连贯面部表情图像。我们提出的级联EF-GAN的结果如图1所示。

本文的贡献

(1)首先,我们确定了局部焦点在面部表情编辑中的重要性,并提出了一种新的EF-GAN,它可以捕获具有多个局部焦点的身份相关特征,并有效地减少编辑伪影和模糊。

(2)其次,我们提出了一个创新的渐进式面部表情编辑级联设计。级联设计在处理较大间隙的表情转化时,在抑制重叠伪影方面是稳健而有效的。(重叠伪影指的是原始表达式和目标表达式在输出中混合的伪影)。

(3)第三,大量实验表明,Cascade EF-GAN在定量和定性上都实现了出色的面部表情编辑。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Cascade EF-GAN: 局部聚焦渐进式面部表情编辑 的相关文章

随机推荐

  • 802.11 帧格式及类型

    1 帧格式 下面是802 11帧的组成结构 帧总寻此结构 从上面的结构可以知道 前俩个字节为 帧控制字段 控制字段的前2bit节为 协议类型 目前此值为 0 1 控制帧 用于竞争期间的握手通信和正向确认 结束非竞争期等 2 管理帧 主要用于
  • Altium designer10---PCB添加Logo

    安全之安全 security 博客目录导读 目录 1 生成bmp后缀的图片 画图打开 调整大小 生成bmp 2 生成PCB Logo PCB Logo Creator 图标生成器 Load加载 Convert转换 3 复制到所制作板子的PC
  • python基础八:函数

    1 函数简介 1 1语法 语法 def 函数名 形参1 形参2 形参3 代码块 函数名 调用函数 1 2介绍 函数是个对象 function 函数用来保存一些可执行的代码 在你需要的时候可以对这些语句进行多次调用 函数中保存的代码不会立即执
  • Sublime Text 4 汉化 安装Install Package Mac 安装插件

    1 下载安装包Sublime Text 4 官网选择安装包下载 下载完成直接打开 下载应用程序 运行应用程序 2 Sublime Text 4 跳过 不需要 安装Install Package工具 Text 4 不需要安装Package工具
  • Description:Web server failed to start. Port 8080 was already in use.

    APPLICATION FAILED TO START Description Web server failed to start Port 8080 was already in use Action Identify and stop
  • 顺序表——简单实现(静态数组)

    实现基于静态数组的顺序表的以下基本操作 1 初始化 2 尾插 3 尾删 4 头插 5 头删 6 读任意位置元素 7 修改任意位置元素 8 查找指定元素值的下标 9 在任意位置插入元素 实现环境 Centos6 5 vim编辑器 大体的思路
  • web前端字体居中_css文字居中怎么弄?

    CSS是一种定义样式结构如字体 颜色 位置等的语言 被用于描述网页上的信息格式化和现实的方式 下面我们来看一下css设置文字居中的方法 css可以通过为文字所在标签添加text align center样式使文字居中 text align属
  • git冲突在eclipse、idea、sourceTree上的解决方法

    一 使用eclipse时 情形一 用户1编辑A文件并提交 用户2未拉取最近代码也编辑A文件产生的冲突 用户2未提交本地仓库时 1 进入同步页面 注意 只有一个向下箭头表示未提交本地仓库 2 拉取远程文件 双击冲突文件减去编辑 将右侧代码合并
  • IT实习技能提升第一篇

    文章目录 前言 一 Git 1 基础配置 2 老板让去git上拉取代码 3 更改完代码后上推 二 QT使用步骤 1 注册QT账号挺有必要 2 同时运行两个项目 总结 前言 新入职的码农 嵌入式软件方向 提示 以下是本篇文章正文内容 下面案例
  • IOS小白入门指南

    加入ios 项目已经一个多月了 本篇文章主要介绍IOS开发入门的一些基础知识 帮助想学习iOS开发的人更有效率地学习 目录 需要的计算机基础 开发语言选择 IOS两种开发语言的异同 Objective C和swift的相同点 二者的不同点
  • 关于webview加载网页,返回后总是刷新页面问题解决

    最近用webview发现返回上个页面总是又自动刷新页面 我的需求是进入下页的时候不用缓存 而返回上个页面的时候不要刷新页面回到顶部 要保持在原来页面进入下页的位置 首先来了解一下webview加载网页的几个模式 即websetting中设置
  • 【AI视野·今日CV 计算机视觉论文速览 第211期】Wed, 2 Jun 2021

    AI视野 今日CS CV 计算机视觉论文速览 Wed 2 Jun 2021 Totally 63 papers 上期速览 更多精彩请移步主页 Interesting YOLOS You Only Look at One Sequence 纯
  • 冲击python二级——python的安装,IDLE的一般操作,PIP包管理使用,变量基础

    现在大部分的教程 都会要求直接安装Anaconda 和Pycharm 虽然pycharm是非常优秀的python IDE生产工具 但是对于新手来说配置比较繁琐 并不友好 而且国考计算机二级 只能用python自带的idle 用pip包管理安
  • 大数据——基于Spark Streaming的流数据处理和分析

    基于Spark Streaming的流数据处理和分析 流是什么 为什么需要流处理 流处理应用场景 如何进行流处理 Spark Streaming简介 Spark Streaming流数据处理架构 Spark Streaming内部工作流程
  • 实验室项目——连接mysql服务器报错(驱动版本不一致)

    mysql right syntax to use near OPTION SQL SELECT LIMIT 15 at line 1 问题描述 OPTION SQL SELECT LIMIT XXX 问题原因 项目使用的mysql驱动和m
  • 集线器、交换机和路由器(图解)

    一 物理层 使用 MAC 解决设备的身份证问题 1 通信的原始时代 很久很久之前 你不与任何其他电脑相连接 孤苦伶仃 直到有一天 你希望与另一台电脑 B 建立通信 于是你们各开了一个网口 用一根网线连接了起来 用一根网线连接起来怎么就能 通
  • UEFI/Legacy bios简介与grub安装教程

    目录 一 BIOS简介 二 UEFI与Legacy 启动模式简介 Legacy启动模式 UEFI启动模式 具体不同 三 grub安装 grub软件包的安装 grub源码下载 grub本地编译安装及使用 Ubuntu 环境下 四 参考 一 B
  • 华为机试-8.计算面积(绘图机器的绘图笔初始位置在原点)

    计算面积 绘图机器的绘图笔初始位i在原点 0 0 机器启动后其绘图笔按下面规则绘制直线 1 尝试沿着横向坐标轴正向绘制直线 直到给定的终点值E 2 期间可通过指令在纵坐标轴方向进行偏移 井同时恰制直线 偏移后按规则1绘制直线 指令的格式为X
  • chatgpt赋能python:Python输出中出现的None值:问题、解释和解决方案

    Python输出中出现的None值 问题 解释和解决方案 在Python编程中 经常会出现输出中包含None值的情况 这会给程序员带来一些困扰 因为它可能会在应用程序中导致错误或不正确的结果 在本篇文章中 我们将探寻这个问题的原因 介绍有关
  • Cascade EF-GAN: 局部聚焦渐进式面部表情编辑

    目前面部表情编辑存在的问题 生成性对抗网络 GAN 的最新进展表明 面部表情编辑有了显著的改进 然而 当前的方法仍然容易在表达密集型区域周围产生伪影和模糊 并且在处理大间隙表达转换 例如从愤怒到大笑的转换 时 经常引入不希望的重叠伪影 本文