Feedback Network for Image Super-Resolution（SRFBN）---翻译

2023-05-16

attention ：只详细翻译了重点部分

摘要
图像超分辨率（SR）的最新进展展现了深度学习的力量，可以实现更好的重建性能。然而，现有的基于深度学习的图像SR方法尚未充分利用人类视觉系统中常见的反馈机制。在本文中，我们提出了一个图像超分辨率反馈网络(SRFBN)来改进具有高级信息的低级表示。具体而言，我们在具有约束的RNN中使用隐藏状态来实现这种反馈方式。反馈模块旨在处理反馈连接并生成强大的高级表示。所提出的SRFBN具有强大的早期重建能力，可以逐步创建最终的高分辨率图像。此外，我们引入了curriculum learning 策略，使网络非常适合于更复杂的任务，其中低分辨率图像被多种类型的降级破坏。广泛的实验结果证明了与现有技术方法相比，所提出的SRFBN的优越性。

1.介绍
随着网络的深度增加，参数的数量也会增加。大容量网络将占用大量存储资源并遭受过度拟合问题。
为了减少网络参数，通常采用循环结构。最近的研究[22,10]表明，许多具有重复结构的网络（例如DRCN [19]和DRRN [31]）可以外推为单状态逆流神经网络（RNN)。与大多数传统的基于深度学习的方法类似，具有重复结构的这些网络可以以前馈方式共享信息。然而，前馈方式使得先前的层不可能从以下层访问有用信息，即使采用跳过连接也是如此。
在认知理论中，连接皮层视觉区域的反馈连接可以将响应信号从高阶区域传输到低阶区域[17,19]。受此现象的推动，最近的研究[30,40]将反馈机制应用于网络架构。这些体系结构中的反馈机制以自上而下的方式工作，将高级信息传回到先前的层并改进低级编码信息。
在本文中，我们提出了一种新的图像SR网络，即超分辨率反馈网络（SRFBN），以便通过反馈连接使用高级信息来改进低级信息。所提出的SRFBN本质上是具有反馈块（FB）的RNN，其专门用于图像SR任务。FB由多组上下采样层构成，具有密集跳过连接，可生成强大的高级表示。受[40]的启发，我们使用FB的输出，即展开的RNN中的隐藏状态，以实现反馈方式（见图1（a））。每次迭代的隐藏状态流入下一次迭代以调制输入。为了确保隐藏状态包含HR图像的信息，我们将损失连接到训练过程中的每次迭代。我们的反馈方案的原理是粗略SR图像的信息可以促进LR图像重建更好的SR图像（参见图1（b））。此外，我们为案例设计了一个课程，其中LR图像由复杂的退化模型生成。对于每个LR图像，其基于恢复难度的连续迭代的目标HR图像从易到难排列。这种课程学习策略很好地帮助我们提出的SRFBN处理复杂的退化模型。实验结果证明了我们提出的SRFBN与其他最先进方法的优越性。

在这里插入图片描述
总之，我们的主要贡献如下：

提出采用反馈机制的图像超分辨率反馈网络（SRFBN）。通过反馈连接在自上而下的反馈流中提供高级信息。同时，这种具有反馈连接的循环结构提供了强大的早期重建能力，并且仅需要很少的参数。
提出反馈块（FB），它不仅可以有效地处理反馈信息流，还可以通过上采样层和下采样层以及密集跳过连接来丰富高级表示。
为SRFBN提出curriculum -based训练策略，其中将具有增加的重建难度的HR图像作为连续迭代的目标馈入网络。该策略使网络能够逐步学习复杂的退化模型，而对于那些只有一步预测的方法，同样的策略是不可能的。

2.相关工作
2.1基于深度学习的SR
略
2.2反馈机制
反馈机制允许网络携带输出概念以纠正先前的状态。最近，许多网络架构已经采用反馈机制来完成各种视觉任务[5,4,40,11,10,28]。对于图像SR，一些研究也显示了引入反馈机制的努力。基于反投影，Haris等 [11]设计了上升和下降投影单元，以实现迭代误差反馈。Han等人 [10]应用了延迟反馈机制，该机制在双态RNN中的两个重复状态之间传输信息。然而，与我们的网络架构不同，从LR图像到最终SR图像的信息流仍然是前馈的。
我们最相关的工作是[40]，它将具有高级信息的隐藏状态转移到输入图像的信息，以实现卷积递归神经网络中的反馈。然而，它旨在解决高级视觉任务，例如，分类。为了在图像SR中拟合反馈机制，我们精心设计了反馈块（FB）作为SRFBN中的基本模块，而不是像[40]中那样使用ConvLSTM。我们FB中的信息通过密集跳过连接有效地跨层级层流动。实验结果表明, 我们的FB具有优于ConvLSTM1的重建性能，因此更适合于图像SR任务。

2.3curriculum learning
Curriculum learning [2]逐渐增加了学习目标的难度，众所周知，这是改进训练程序的有效策略。早期的课程学习工作主要集中在一项任务上。 Pentina等 [27]以连续的方式将课程学习扩展到多个任务。高等人 [8]利用课程学习解决图像恢复中的固定问题。由于他们的网络仅限于一次性预测，他们通过在训练过程中随着时代的增加而提供任务复杂性的不同训练数据来强制执行课程。在图像SR的背景下，Wang等人[38]设计了金字塔结构的课程，在以前训练过的网络中逐渐融合金字塔的新层次，将LR图像升级到更大的尺寸。
虽然之前的工作主要集中在单个degradation（劣化）过程，但我们对案例强制执行curriculum ，其中LR图像被多种类型的劣化所破坏。包含易于做出决策的curriculum可以针对一个问题进行解决，以逐步恢复损坏的LR图像。

3.feedback network for image SR
反馈系统包含两个要求：(1)迭代性和(2)改变系统的输出以更正每个循环中的输入。这种迭代因果过程有助于实现我们的图像SR反馈方案的原理：高级信息可以引导LR图像以恢复更好的SR图像(参见图1(b))。
在所提出的网络中，实施我们的反馈方案有三个必不可少的部分：
（1）在每次迭代时绑定损失（迫使网络在每次迭代时重建SR图像，从而允许隐藏状态携带高级信息的概念）
（2）使用循环结构（实现迭代过程）
（3）在每次迭代时提供LR输入(以确保低级信息的可用性，这是需要被精炼的)。
如果缺少这三个部分，网络将无法推动反馈流程。

3.1网络结构
在这里插入图片描述

3.2. Feedback block
在这里插入图片描述

3.4. Implementation details
4.实验结果
4.1 settings
Datasets and metrics
Training dataset: DIV2K and Flickr2K, make data augmentation
Metrics: PSNR, SSIM
定量结果分析：仅在Y通道上
退化（degradation）方法：bicubic(BI)下采样。为证明我们curriculum learning的有效性，我们另外实验了加了两种退化模型，在4.4和4.5.3中。
BD:加了高斯blur的下采样。设置为7x7的gaussian kernel with standard deviation 1.6 for blurring.
DN：伴随着noise level为30的adding gaussian noise 的bicubic下采样
训练相关设置：batch size为16，为充分利用LR图像上下文信息，我们根据提升因子给出不同大小的RGB patch。输入patch大小设置在表1中给出。使用【12】的方法初始化网络参数，采用ADAM优化器，初始学习率为0.0001.每200个epoch学习率乘以0.5。在pytorch中，用1080Ti GPU训练网络。
在这里插入图片描述
4.2 study of T and G
在这一小节中，我们探讨了迭代次数(表示为T)和反馈块中投影组的数目(表示为G)的影响。在随后的实验中，滤波器的基数m被设置为32。我们首先通过将G固定到6来研究T的影响。可以从图4(A)中观察到，在反馈连接的帮助下，与无反馈连接的网络(T=1)相比，重建性能明显提高。此外，随着T的不断增加，重建质量也在不断提高。换句话说，我们的反馈块肯定有利于跨时间的信息流。然后，我们通过将T固定到4来研究G的影响。图4(B)示出更大的G由于更深的网络的更强的代表能力而导致更高的精确度。总之，选择更大的T或G都有助于取得更好的结果。值得注意的是，小T和G仍然优于VDSR[18]。在下面的讨论中，我们使用SRFBN-L(T=4，G=6)进行分析。
在这里插入图片描述
实验结果比较

5. 结论
本文提出了一种新的图像SR网络-超分辨率反馈网络(SRFBN)，通过增强高层次的图像表示来忠实地重建SR图像。网络中的反馈块(FB)可以有效地处理反馈信息流和特征重用。此外，还提出了一种curriculum学习策略，使网络能够很好地适应复杂退化模型破坏低分辨率图像的复杂任务。综合实验结果表明，所提出的SRFBN能以极小的参数提供与现有方法相比的比较或更好的性能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Feedback Network for Image Super-Resolution（SRFBN）---翻译的相关文章

如何在 Node.js 中将 HTML 转换为图像

我需要在 Node 服务器上将 HTML 模板转换为图像服务器将以字符串形式接收 HTML 我尝试过 PhantomJS 使用一个名为 Webshot 的库但它不能很好地与 Flex 框和现代 CSS 配合使用我尝试使用 Chrome
如何使用 Misc.imread 将图像分割为红色、绿色和蓝色通道

我正在尝试将图像切片为 RGB 但在绘制这些图像时遇到问题我使用此函数从某个文件夹获取所有图像 def get images path image type image list for filename in glob glob pat
Nodejs Base64 中的读取文件

我正在尝试从客户端读取以 base64 编码的图像如何使用nodejs进行阅读 My code add to buffer base64 image var encondedImage new Buffer image name base
使用 TCPDF PHP 库横向显示的图像

我正在使用 TCPDF PHP 库生成包含照片的 PDF 文档由于某种原因某些照片在我的计算机和网络上正确显示但当我将该图像放入 PDF 中时它似乎是横向的这只发生在某些图像上大多数图像显示正确下面是在 PDF 中横向显示的示
GKE 出现错误：ImagePullBackOff 和错误：ErrImagePull 错误

当 kubectl 应用 yaml 将自定义构建的 docker 映像部署到 GCP 中的集群编辑掉敏感信息时我收到以下错误已尝试以下但没有运气手动部署镜像检查以确保防火墙规则允许 443 并且没有任何东西阻止它尝试将容器注册
iOS - 基于设备的不同图像或缩放相同的图像？

似乎开发人员总是为不同的设备创建不同的图像资源并根据设备加载它们但是只为最高分辨率的设备 iPad 创建图像然后为 iPhone 6 5 等缩小该图像有什么缺点吗我使用 SpriteKit 因此我只需创建不同大小的 SKSpri
如果在构造函数中使用 super 调用重写方法会发生什么

有两个班级Super1 and Sub1 超1级 public class Super1 Super1 this printThree public void printThree System out println Print Thre
图像未显示在从 HTML 创建的 PDF 上

我想动态创建 PDF 这意味着我将从 Google Drive 获取文件然后将它们放入 HTML 代码中并尝试从中创建 PDF 一切工作正常除了图像没有显示我现在正在做的是从 HTML 字符串创建 HtmlOutput 获取该 H
在 Python 中倾斜数组

我有一个 2D 数组我将使用它保存为灰度图像scipy misc toimage 在此之前我想将图像倾斜给定角度像这样进行插值scipy ndimage interpolation rotate 上图只是为了说明倾斜过程我知道我必须
Swift 5 MacOS 图像调整大小内存问题

我是使用 Swift 进行 Mac OS 应用程序开发的新手但我尝试制作简单的 ImageResizer 应用程序我必须调整 50k 图像的大小 10个小时后内存已增加到近120GB 我以为 Swift 也有垃圾收集器为什么它可以增
在 Android 上将大位图文件的大小调整为缩放的输出文件

我的文件中有一个大位图例如 3888x2592 现在我想将该位图大小调整为 800x533 并将其保存到另一个文件中我通常会通过调用来缩放位图Bitmap createBitmap方法但它需要一个源位图作为第一个参数我无法提供它
显示居中的图像行

我有一排三张图像目前显示得很好现在我想在这三个图像的正下方显示另外两个图像并且我希望它们居中它看起来有点像一个颠倒的金字塔无论我做什么底行都保持左对齐这是 css category width 176px font size
在 Swift 中将 gif 保存到 iOS 照片库

我正在尝试保存位于已使用 Regift 代码创建的临时文件中的 GIF 图像 Regift https github com matthewpalmer Regift https github com matthewpalmer Regif
无法通过电子应用程序在discordjs上发送附加到消息的图像

我正在尝试为我使用discordjs 编写的discord 机器人构建图形界面但是我在发送图像时遇到了问题这是我的代码中负责向用户发送消息的部分 utilsateur createDM then channeltemp gt let
文章中的内联图像和标题 - 使标题的宽度与图像的宽度一致

这是我的代码 div class image img src image jpg alt Image description p class caption This is the image caption p div 这是我的 CSS
在Android内存中存储gif图像

我对安卓还很陌生我想将图像保存到内存中然后从内存中检索图像并将其加载到图像视图中我已使用以下代码成功将图像存储在内存中 void saveImage String fileName img cnt jpg File file new
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
WinForms - 加载表单时如何使用 PaintEventArgs 运行函数？

我试图理解图形在 Graphics FromImage 文档中它有这样的示例 private void FromImageImage PaintEventArgs e Create image Image imageFile Image
Javascript - 检测 Youtube 默认缩略图

有什么方法可以查看 Youtube 缩略图是否真的存在或者 Youtube 只是用默认缩略图替换了它例如没有此缩略图的视频 http img youtube com vi G75WApUdYJ4 maxresdefault jpg h
使用 HttpUrlConnection Android 将 base64 编码的图像发送到服务器

我正在尝试使用 HttpUrlConnection 将 base64 编码的图像发送到服务器我遇到的问题是大多数图像均已成功发送但有些图像会生成 FileNotFound 异常我的图像编码代码可以在下面找到 public static

随机推荐

C++20新特性个人总结

目录 1 关键字 1 1 concept 1 2 requires 1 3 typename 1 4 explicit 1 5 constexpr 1 6 char8 t 1 7 consteval 1 8 co await co yiel
MySQL | MySQL为什么建议不要使用视图

MySQL为什么建议不要使用视图一什么是视图二为什么不建议使用视图一什么是视图官方定义 xff1a 视图是指计算机数据库中的视图 xff0c 是一个虚拟表 xff0c 其内容由查询定义同真实的表一样 xff0c 视图包含一系列
【数据标准】学院数据集标准规范-1.6-元数据XML

XML概述 XML 基础教育教学资源元数据的数据模型定义了一个层次结构的概念模型 xff0c 层次结构的模型可以方便地表示包含许多元素和子元素的数据 XML非常适合表示层次结构的模型 XML文档就是层次结构的 xff0c 它由元素组成 xf
Python-音频处理之wav文件与十进制pcm文件的相互转换

一 pcm转wav 1 pcm文件以十进制的格式保存 xff0c 因此读取pcm的txt文件时不用 rb 来读取 2 适用于写单通道wav文件 xff0c 多通道需要对数据进行reshape操作 import wave import str
webapp打包为Android的apk包的一种方法

开发了个纯web的app小demo 想着最终集成到微信公众号上做个小功能 xff0c 并测试下如何跨平台的运行在Android上关于如何打包为Android的安装包 xff0c 总结了下其中的一种方法 xff0c 使用cordova打包为
滤波算法（二）—— 中位值滤波算法

1 算法介绍中位值滤波算法的实现方法是采集N个周期的数据 xff0c 去掉N个周期数据中的最大值和最小值 xff0c 取剩下的数据的平均值中位值滤波算法特别适用于会偶然出现异常值的系统中位值滤波算法应用比较广泛 xff0c 比如用于一
C++可变参数使用总结

可变参数是指函数可以接受不定数量的参数比如在printf函数 xff0c 如果做日志等功能也会用到这里总结下可变参数的使用 c语言中的可变参数先介绍下在c语言中的使用 xff0c c语言也支持可变参数 xff0c 只是需要借助下va
替代notepad++,notepad--介绍及插件cmake编译

Notepad 43 43 是一个文本编辑器小软件 xff0c 用来替代windows自带的记事本然而Notepad 43 43 软件的作者太霸道 xff0c 如果你不赞同他的观点 xff0c Notepad 43 43 将会在你的源码里
[环境搭建] onlyoffice环境搭建（docker-compose）

只介绍环境搭建不介绍集成一环境要求内核 xff1a Linux 操作系统 xff1a centos 或者 ubuntu 容器环境 xff1a docker 容器镜像 xff1a onlyoffice documentserver 二
WSL：系统迁移【WSL默认安装在C盘，可以将虚拟机移到任意位置】

因为虚拟机 xff08 Ubuntu22 04 xff09 默认安装在C盘 xff0c 大量占用系统盘的空间 xff0c 所以迁移到其他盘中查看安装的虚拟机 wsl l v 关闭所有正在运行的虚拟机 wsl shutdown 对需要迁移的
Microsoft 365 Copilot怎么安装，如何下载？

Microsoft 365 Copilot是一款基于人工智能的数字助手 xff0c 旨在帮助Microsoft 365商业版的用户更轻松地管理其工作流程它可以提供实时反馈自动生成报告优化时间表以及自动化办公任务等功能 xff0c 这些
关于Sublime Text4 _4126

目录前言一下载安装下载安装二汉化 Install PackageChineseLocalzations 三激活进入hexed网站编辑编辑改码另存为四运行 successfully 总结前言怕以后忘了 xff0c 上操
CSDN编写技巧--CSDN中高亮显示代码

介绍一种好的格式如下 xff1a 实现的方法就是以原代码的形式显示页面 xff0c 然后复制以下代码 xff1a lt div style 61 34 BORDER BOTTOM cccccc 1px dashed BORDER LEFT
去掉jOSN中的转义符

json返回全都是带 39 39 的于是要去掉这个反斜杠但是OC里面的 39 39 是转义符不能直接用 64 34 34 之类的表示一顿搜索之后找到了OC对转义字符的表示方法如下 a Sound alert b 退格 f For
微软 Win11 一个命令安装 Windows Linux 子系统（WSL）

在最新的 Windows 11操作系统中 xff0c 你只需运行 wsl exe install 就可以安装运行 WSL 所需的一切使用 wsl install 微软表示 xff0c 以前设置 WSL 的过程过于复杂 xff0c 涉及到开
linux服务器xrdp远程链接密码对了却password failed解决方法

linux服务器xrdp远程链接密码对了却password failed解决方法遇到问题问题定位解决参考链接遇到问题在win10下用自带的远程连接登陆服务器 xff0c 明明密码对了 xff0c 却无法登陆 xff0c 显示 pass
滤波算法（四）—— 卡尔曼滤波算法

一算法介绍卡尔曼滤波是一个神奇的滤波算法 xff0c 应用非常广泛 xff0c 它是一种结合先验经验测量更新的状态估计算法 1 状态估计首先 xff0c 对于一个我们关心的物理量 xff0c 我们假设它符合下面的规律其中 xff0
selenium-Firefox浏览器驱动geckodriver的下载配置

首先下载Firefox的驱动 xff0c 地址 xff1a geckodriver Mirror 选择最新的版本 xff0c 进入后选择对应的系统下载 xff1a 将下载下来的文件放入到自己python的安装目录中的Scripts文件夹中即
行人检测之HOG——方向梯度直方图(Histogram of Oriented Gradient）

写在前面的话 HOG 绝对说的是行人检测领域的一个标志性的里程碑 xff0c 虽然 2008 年出现的 DPM DeformablePart Model 方法取得了更好的检测效果 xff0c 但是实时性实在堪忧 xff0c 就算用多线程实现
Feedback Network for Image Super-Resolution（SRFBN）---翻译

attention xff1a 只详细翻译了重点部分摘要图像超分辨率 xff08 SR xff09 的最新进展展现了深度学习的力量 xff0c 可以实现更好的重建性能然而 xff0c 现有的基于深度学习的图像SR方法尚未充分利用人类视

Feedback Network for Image Super-Resolution（SRFBN）---翻译

Feedback Network for Image Super-Resolution（SRFBN）---翻译 的相关文章

随机推荐

热门标签

Feedback Network for Image Super-Resolution（SRFBN）---翻译的相关文章