UFA-FUSE:一种用于多聚焦图像融合的新型深度监督混合模型

2023-05-16

点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达

小白导读
论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

8d1cde79047df9df55d5ce2037d8bb93.png

6cf28db263c63745ee6b0429f42c6ddd.png

摘要

传统的融合方法和基于深度学习的融合方法通过一系列后处理过程生成中间决策图,得到融合图像。然而,这些方法产生的融合结果容易丢失源图像的一些细节或产生伪影。受到基于深度学习的图像重建技术的启发,我们提出了一种不需要任何后处理的多焦点图像融合网络框架,以端到端监督学习的方式解决这些问题。为了充分训练融合模型,我们生成了一个包含地面真实融合图像的大规模多聚焦图像数据集。为了获得信息更丰富的融合图像,进一步设计了一种基于统一融合注意的融合策略,该融合策略由通道注意模块和空间注意模块组成。

具体而言,本文提出的融合方法主要包括三个关键部分:特征提取、特征融合和图像重建。

我们首先利用七个卷积块从源图像中提取图像特征。然后,在特征融合层,利用所提出的融合策略对提取的卷积特征进行融合。最后,通过四个卷积块重构融合后的图像特征。实验结果表明,与目前最先进的19种多聚焦图像融合方法相比,该方法具有显著的融合性能。

论文创新点

提出了一种新的多聚焦图像融合模型。融合模型可以端到端训练,不需要任何后处理过程,直接获得融合图像,不需要生成中间决策图。为了有效地训练融合模型,我们创建了一个包含ground-truth融合图像的大规模多聚焦图像数据集。为了获得高质量的融合图像,我们设计了一种基于统一融合注意机制的融合策略。首先在特征提取模块中对源图像进行7个卷积块叠加提取。然后利用所提出的融合策略对提取的图像特征进行融合。最后,对融合后的图像特征进行四个卷积块叠加重构,生成融合图像。此外,我们进行了大量的实验来评估我们所提出的融合模型的性能。定性评价和定量评价的结果表明,我们的融合模型取得了显著的效果,优于目前最先进的多聚焦图像融合算法。总的来说,我们的工作对多焦点图像融合的主要贡献有四个方面:

  • 为了实现多焦点图像融合,建立了一个大规模的多焦点图像数据集。数据集中生成的多焦点图像具有部分聚焦和不同模糊程度,适合于融合模型的训练。此外,我们还介绍了如何生成大规模的多焦点图像数据集,这对制作数据集有很大的参考意义。

  • 设计了一种新颖、合适的融合策略。基于所提出的统一融合注意力的融合策略能够有效地融合所提取的图像特征,同时比其他简单的融合策略更加灵活。

  • 提出了一种不需要任何后处理过程的端到端融合框架。这样,融合模型中的所有参数都可以联合优化,融合网络可以直接输入融合图像,而无需生成中间决策图。

  • 在红外和可见光图像数据集以及医学图像数据集上进行了一些扩展实验。进一步,我们提出的融合模型在其他融合任务的潜在应用。

模型架构

我们提出的融合框架主要包括三个部分:特征提取、特征融合和图像构建。首先,在特征提取模块中,我们采用7个堆叠的卷积块从多焦点源图像中提取图像特征,卷积块由一个核大小为3 3的卷积层和leakyRelu激活函数组成。对于输入源图像的每个卷积特征,利用我们提出的特征融合模块对得到的特征进行融合。最后,使用由四个堆叠的卷积块组成的图像构造模块对融合后的图像特征进行重构,生成融合图像。此外,为了获得更准确的融合图像,我们在训练阶段使用损失函数L来训练我们的融合网络。

04f2ecc6330b4fa797be02ec4a967574.png

在特征融合过程中,我们提出了一种新的特征融合策略。具体来说,我们的融合策略是基于统一融合注意力,并在这种高效架构的基础上开发通道和空间注意力。UFA模块的演示如图上图所示。

实验结果

a79d6a94281fd5dce63686ebe48dcd21.png

f7967ee8278e79d1016d429ae82215d9.png

9c22ee5cc6c12bf1fcdfaa890335b45b.png

3359dcb0db6a6312eadafa3dd46247a1.png

结论

本文提出了一种新颖有效的图像融合模型,该模型采用有监督学习策略进行端到端训练。该方法避免了生成中间决策图,并利用后处理程序对决策图进行细化,实现了图像融合。此外,为了对所提出的融合模型进行精细训练,我们生成了一个包含ground-truth融合图像的大规模多焦点图像数据集,并设计了一种基于统一融合注意力的融合策略,在特征融合过程中可以保留更多的图像信息。首先从多个输入图像中提取出显著特征。然后利用提出的统一融合注意对提取的卷积特征进行融合。最后,将融合后的图像特征输入到级联的卷积块中重建融合图像。实验结果表明,本文所提出的融合算法能够产生高质量的融合图像。此外,对扩展实验的定性和定量评价也表明我们所提出的融合框架在其他图像融合任务中是有效的。

论文链接:https://arxiv.org/abs/2101.04506

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

小白团队出品:零基础精通语义分割↓

9693be17a47aec37a7fc392533eaf109.png

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

53fc8786ea76fd4a9feb0edc99b8fd32.png

29b56e2098da42680e4fae98783022e3.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

UFA-FUSE:一种用于多聚焦图像融合的新型深度监督混合模型 的相关文章

  • 以Crotex M3为例讲解stm32芯片内部原理

    一款STM32F103ZET6是72Mhz 64kRAM 512kROM为例进行简要分析其MCU工作原理 1 分清几个概念 1 1RAM可读写静态储存器 平常所说的DDR就是RAM的一种 用于CPU直接交换数据 1 2ROM只可读静态存储器
  • 内外网共用操作

    1 首先将内网 外网的两根网线接入交换机 xff0c 再从交换机出来一根线接入你的电脑 xff08 如果是路由器的话 xff0c 内网 外网的网线接入LAN口 xff0c 再从LAN口出来一根线接入你的电脑 xff09 2 打开IP设置 x
  • 【从零学习OpenCV 4】了解OpenCV的模块架构

    本文首发于 小白学视觉 微信公众号 xff0c 欢迎关注公众号 本文作者为小白 xff0c 版权归人民邮电出版社所有 xff0c 禁止转载 xff0c 侵权必究 xff01 经过几个月的努力 xff0c 小白终于完成了市面上第一本OpenC
  • 对象检测和图像分割有什么区别?

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 01 人工智能中的图像预处理 对象检测和图像分割是计算机视觉的两种方法 xff0c 这两种处理手段在人工智能领域内相当常见 xff0c

随机推荐

  • 基于OpenCV的网络实时视频流传输

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 很多小伙伴都不会在家里或者办公室安装网络摄像头或监视摄像头 但是有时 xff0c 大家又希望能够随时随地观看视频直播 大多数人会选择使
  • 英伟达 GPU显卡计算能力查询表

    近期小白因为项目需要开始在电脑上配置深度学习环境 经过一些列的苦难折磨之后 xff0c 电脑环境终于配置好了 xff0c 但是却被我的显卡劝退了 我是用的是算力2 1的显卡 xff0c 环境要求算力3以上的显卡 xff0c 无奈最后只能使用
  • 一文看懂激光雷达

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 来源 xff1a 摘自中信证券 与雷达工作原理类似 xff0c 激光雷达通过测量激光信号的时间差和相位差来确定距离 xff0c 但其最
  • 传统CV和深度学习方法的比较

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 本文转自 xff1a 新机器视觉 摘要 xff1a 深度学习推动了数字图像处理领域的极限 但是 xff0c 这并不是说传统计算机视觉技
  • Opencv实战 | 用摄像头自动化跟踪特定颜色物体

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 本文转自 xff1a 新机器视觉 1 导语 在之前的某个教程里 xff0c 我们探讨了如何控制Pan Tilt Servo设备来安置一
  • 使用OpenCV和TesseractOCR进行车牌检测

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 目录 1 xff09 目的和简介 2 xff09 前言 3 xff09 使用OpenCV和Haar级联进行车牌检测 4 xff09 使
  • GPS(全球定位系统)

    GPS 全球定位系 统 xff0c 是美国国防部为陆 xff0c 海 xff0c 空三军研制的新一代卫星导航定位系统 xff0c 它是以 24 颗人造卫星作为基础 xff0c 全天候地向全球各地用户提供时实的三维定位 三维测速和全球同步时间
  • 单应性矩阵应用-基于特征的图像拼接

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 本文转自 xff1a 深度学习这件小事 前言 前面写了一篇关于单应性矩阵的相关文章 xff0c 结尾说到基于特征的图像拼接跟对象检测中
  • 前沿 | 一文详解自动驾驶激光雷达和摄像头的数据融合方法

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 本文转自 xff1a 计算机视觉联盟 自动驾驶感知模块中传感器融合已经成为了标配 xff0c 只是这里融合的层次有不同 xff0c 可
  • 使用 YOLO 进行目标检测

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 自从世界了解人工智能以来 xff0c 有一个特别的用例已经被讨论了很多 它们是自动驾驶汽车 我们经常在科幻电影中听到 读到甚至看到这些
  • 概述 | 全景图像拼接技术全解析

    点 击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 前言 图像 视频拼接的主要目的是为了解决相机视野 xff08 FOV Field Of View xff09 限制 xff0c 生成
  • 我靠这份无人机完全指南吹了一整年牛!

    对于多数无人机爱好者来说 xff0c 能自己从头开始组装一台无人机 xff0c 之后加入AI算法 xff0c 能够航拍 xff0c 可以进行目标跟踪 xff0c 是每个人心中的梦想 亲自从零开始完成复杂系统 xff0c 这是掌握核心技术的必
  • 奇异值分解(SVD)原理总结

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 前言 奇异值分解 xff08 SVD xff09 在降维 xff0c 数据压缩 xff0c 推荐系统等有广泛的应用 xff0c 任何矩
  • 用Python实现神经网络(附完整代码)!

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 在学习神经网络之前 xff0c 我们需要对神经网络底层先做一个基本的了解 我们将在本节介绍感知机 反向传播算法以及多种梯度下降法以给大
  • 一文图解卡尔曼滤波(Kalman Filter)

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 译者注 xff1a 这恐怕是全网有关卡尔曼滤波最简单易懂的解释 xff0c 如果你认真的读完本文 xff0c 你将对卡尔曼滤波有一个更
  • 计算机视觉方法概述

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 一 资源简介 今天给大家推荐一份最新的计算机视觉方法概述 xff0c 这份综述详细的讲述了当前计算机视觉领域中各种机器学习 xff0c
  • 通俗易懂的YOLO系列(从V1到V5)模型解读!

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 0 前言 本文目的是用尽量浅显易懂的语言让零基础小白能够理解什么是YOLO系列模型 xff0c 以及他们的设计思想和改进思路分别是什么
  • PWM电流源型逆变器

    nbsp nbsp nbsp nbsp 随着科学技术和生产力的发展 各种结构型式和各种控制方法的逆变器相继问世 而就逆变器而言 不管输出要求恒频恒压还是变频变压 有效消除或降低输出谐波是基本要求 因而逆变电源的谐波抑制一直是研究者致力于解决
  • 下划线在 Python 中的特殊含义

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 Python 中的下划线 下划线在 Python 中是有特殊含义的 xff0c 它们在 Python 的不同地方使用 下面是 Pyth
  • UFA-FUSE:一种用于多聚焦图像融合的新型深度监督混合模型

    点击上方 小白学视觉 xff0c 选择加 34 星标 34 或 置顶 重磅干货 xff0c 第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯 小白决心每天为大家带来经典或者最新论文的解读和分享 xff0c 旨在帮助各位读者快速了