Zoom to learn, learn to zoom超分辨网络

2023-05-16

目录

  • 论文
  • 主要贡献
  • 背景
  • 创新点一、SR-RAW数据集
  • 创新点二、CoBi损失函数
  • 结果
  • 结论

论文

Zhang X, Chen Q, Ng R, et al. Zoom to learn, learn to zoom[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019: 3762-3770.

主要贡献

  1. 构建了HR-LR真实数据对,提出SR-RAW数据集;
  2. 引入CoBi损失,解决真实数据对引起的两幅图像的对齐问题。

背景

Existing learning-based super-resolution methods do not use real sensor data, instead operating on processed RGB images.

一般的超分辨方法在构建数据集时,多采用的是人工对HR图像进行降级,通过双三次降采样、最近邻插值、添加噪声、模糊核模糊等操作,即使融合了更复杂的降级流程(例如在BSRGAN和RealESRGAN),得到的图像对仍然不是最原生的图像对。即使是kernelGAN通过生成的LR图像和原生HR图像的图像像素分布进行限制,仍然只能模拟、逼近真实LR图像。这就使得生成的LR图像和真实场景下的图像并不匹配,从而导致在这种数据集上训练的模型,只能处理生成的LR图像。
因此作者提出使用相机变焦采集真实的HR-LR对,而减少后续的人工处理。但直接采集真实的HR-LR对时,会导致在训练时产生图像的像素配准问题,针对这一问题,作者参考CX损失,融合图像的空间坐标和特征信息,设计了CoBi损失。

创新点一、SR-RAW数据集

we collect a diverse dataset, SR-RAW, that contains raw sensor data and ground-truth high-resolution images taken with a zoom lens at various zoom levels.

作者收集的HR-LR对是RAW格式的(RAW格式是数码相机拍摄后得到的原始图像数据,我们熟知的jpg、png、bmp等都是在RAW的基础上处理得到)。通过不同的焦距即可获得不同分辨率的原始图像。这种做法可以直接获得X4倍的RAW格式的图像对。
采用这种做法时,不用对LR图像进行额外的人工处理,也不能进行额外的人工处理,因为作者的初衷便是得到最真实的LR数据。

We first match the field of view (FOV) between RAW-L and RGB-H.

但由于RAW格式的图像需要专业软件才能打开,我们平时的软件更多的是能打开RGB类型的图像。因此,为对标现实生活,数据集中低分辨的图像LR可以仍保持RAW格式,而高分辨图像HR需要使用RGB类型的。这可以帮助数码设备在获得原始RAW数据后直接进行超分辨为RGB类型的图像,可以直接由软件读入。

Alignment is then computed between RGB-L and RGB-H to account for slight camera movement caused by manually zooming the camera to adjust focal lengths.

Furthermore, when aligning images with different resolutions, sharp edges in the high-resolution image cannot be exactly aligned with blurry edges in the lowresolution image. The described misalignment in SR-RAW usually causes 40-80 pixel shifts in an 8-megapixel image pair.

通过真实数据对进行训练时的一个最重要的问题是LR和HR之间不能做到完全的对齐,并且,由于LR和HR使用不同焦距的镜头拍摄得到,还有景深、对焦等问题。因此即便在进行对齐矫正后,也难以真正避免对齐问题。如作者所言,图像对常常会产生40-80的像素点偏移。

创新点二、CoBi损失函数

Pixelto-pixel losses such as L1 and L2 generate blurred images due to misalignment in the training data. On the other hand, the recently proposed Contextual Loss (CX) for unaligned data is also unsatisfactory as it only considers features but not their spatial location in the image.

由于使用的数据集的特殊性,作者不能使用任一常用的损失函数,因为这些损失函数作用的数据集都是配准好的。即使是CX损失,对于为配准的图像也不能达到好的效果。因此可以考虑在CX损失的基础上进行改进,CX损失的定义如下:
在这里插入图片描述

Given input image P and its target Q, the contextual loss tries to minimize the summed distance of all matched feature pairs.

P表示生成图像的特征点的集合,Q表示目标图像特征点的集合,CX损失函数表示:对于P的每一个特征点,找到在Q中的某个点,使得这两点间距离最短,然后将P中特征点对应的所有最短距离求和。

Inspired by the edge-preserving bilateral filter, we integrate the spatial pixel coordinates and pixel-level RGB information into the image features.

在这里插入图片描述
在这里插入图片描述
在CX损失的基础上,添加了特征的空间坐标信息。不仅强调了特征之间的相似度,而且还强调了这些相似度高的特征的空间距离的接近程度。因为我们现在考虑的是图像的配准问题,所以必须要考虑生成图像和目标图像的特征的空间关系。使用的具体的网络中,CoBi的公式如下:
在这里插入图片描述
RGB表示直接对生成图像P和目标图像Q进行操作,n表示图像被切分后的patch的大小为n X n;VGG表示将生成图像P和目标图像Q输入到VGG网络后提取得到中间特征图,然后在进行计算损失。

结果

对比实验
在这里插入图片描述
消融实验
在这里插入图片描述

结论

这篇文章帮助理解了TPGSR中的数据集构建,虽然在我们的数据集中,并不会用到真实的RAW格式的数据集。但是其CoBi损失对我们仍有启迪意义,即使作者是针对配准问题提出的CoBi损失,但是这种损失利用了单个像素的坐标信息,进而会利用到单个像素的周边像素信息,提升像素信息的利用率。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Zoom to learn, learn to zoom超分辨网络 的相关文章

  • 二、Scikit-Learn简介

    参考url https jakevdp github io PythonDataScienceHandbook index html Scikit Learn为各种常用机器学习算法提供了高效版本 xff0c 因其干净 统一 管道命令式的AP
  • scikit-learn安装

    一 关于Numpy的安装 最直接的就是在python目录下 xff0c 通过命令窗口 xff0c 直接运行 xff1a pip install numpy 但不知为什么 xff0c 我一直下载失败 xff0c 所以尝试了如下方法 xff0c
  • scikit-learn介绍

    在机器学习和数据挖掘的应用中 xff0c scikit learn是一个功能强大的python包 在数据量不是过大的情况下 xff0c 可以解决大部分问题 学习使用scikit learn的过程中 xff0c 我自己也在补充着机器学习和数据
  • [Python3] 机器学习 ——(二)Scikit-Learn简介

    文章目录 二 Scikit Learn简介 xff08 一 xff09 Scikit Learn的数据表示1 数据表2 特征矩阵3 目标数组 xff08 二 xff09 Scikit Learn的评估器API1 API基础知识2 有监督学习
  • scikit-learn_Scikit Learn-简介

    scikit learn Scikit Learn 简介 Scikit Learn Introduction In this chapter we will understand what is Scikit Learn or Sklear
  • Scikit-Learn简介

    写给自己的备忘 1 简介 对 Python 语言 有所了解的科研人员可能都知道 SciPy 一个开源的基于 Python 的科学计算工具包 基于 SciPy xff0c 目前开发者们针对不同的应用领域已经发展出了为数众多的分支版本 xff0
  • Zoom to learn, learn to zoom超分辨网络

    目录 论文主要贡献背景创新点一 SR RAW数据集创新点二 CoBi损失函数结果结论 论文 Zhang X Chen Q Ng R et al Zoom to learn learn to zoom C Proceedings of the
  • scikit-learn issues - classification metrics can‘t handle a mix of continuous-multioutput ...

    classification metrics can t handle a mix of continuous multioutput and multi label indicator targets 示例场景 xff1a cm 61 c
  • 安装scikit-learn问题

    1 问题描述如下 xff1a pytorch root 64 cento conda install scikit learn Solving environment failed CondaHTTPError HTTP 000 CONNE
  • 【机器学习小白必备】Scikit-learn(Sklearn)最常用的函数这里都帮您总结好了~速速来取!持续更新!

    Scikit learn Sklearn 常用函数详解大全 在这篇文章中 xff0c 总结了sklearn模块常用的函数 xff0c 建议收藏 xff01 因为会持续更新 xff01 文章目录 Scikit learn Sklearn 常用
  • scikit-learn no moudule named six

    在scikit learn版本0 23中删除了模块sklearn externals six 解决方案 要使用它 xff0c 你必须降级到0 22版本及以下 xff0c 可以执行以下命令 pip install scikit span cl
  • css中zoom和scale

    css中我们常用来缩放的样式元素是transform scale xff1b 也还有我们不熟悉的zoom xff0c 在实际的应用场景中 xff0c 我们需要根据自身项目的需要 xff0c 结合不同的解决方案的优缺点来选择适合我们项目解决方
  • Meta-Learning: Learning to Learn Fast

    Meta Learning Learning to Learn Fast 元学习 学习如何学习 译 原文 本文与原文基本没有区别 xff0c 仅供个人学习记录 电子笔记本 前言 xff1a 元学习解决 xff1a 遇到没有见过的任务 xff
  • scipy.ndimage.zoom

    最近邻 选择离它所映射到的位置最近的输入像素的灰度值为插值结果 最临近插值 3X3 的256级灰度图 xff0c 也就是高为3个象素 xff0c 宽也是3个象素的图像 xff0c 每个象素的取值可以是 0 xff0d 255 xff0c 代
  • python_imbalanced-learn非平衡学习包_02_Over-sampling过采样

    python imbalanced learn非平衡学习包 01 简介 python imbalanced learn非平衡学习包 02 Over sampling过采样 后续章节待定 希望各位认可前面已更 您的认可是我的动力 Over s
  • softwares

    视频切帧 变换分辨率 VLC 文件对比 Beyond Compare 远程控制 向日葵 TeamViewer
  • 使用MATLAB做传热学分析及后处理——CFDTool 官方例程

    目录 前言 1 环境配置 2 问题背景 3 传热学例程 heat transfer3 最后 中国加油 武汉加油 前言 cfdtool 官网 https www cfdtool com 是一个MATLAB的扩展工具箱 既然看到这个CFD问题了
  • 如何在 Ubuntu 20.04 上安装 Zoom

    Zoom 应用程序是当今最流行的应用程序之一 Zoom 云会议应用程序通过互联网上的实时消息传递和内容共享提供简化的视频会议 Zoom 客户端允许您无需登录应用程序即可加入会议 要开始新会议 您需要登录该应用程序 访问zoom us创建帐户
  • 输入IP使用JDBC读取数据库信息并返回具体地址

    思路分析 定义连接类 连接数据库 定义properties 存放mysql信息 读取properties 注册驱动 获取连接 定义测试类 运行主程序 定义输入类 检测控制台输入 定义正则表达式 对输入的ip进行判断 判断通过则调用核心逻辑
  • 8款免费企业邮箱

    1 谷歌免费企业邮箱 已收费 标准版 https www google com a cpanel domain new 教育版 https www google com a cpanel education new支持50个帐号 目前每个帐

随机推荐

  • win11安装Anaconda最新版本

    0 前言 xff08 废话可略过 xff1a 从题主开始学python安装anaconda xff0c 已经过去三四年了 xff0c 最近新换了电脑从头再来一遍 xff0c 想来大家学AI大都是从此一步开始的吧 xff0c 想到当初遇到了很
  • 常用的默认端口号

    端口号标识了一个主机上进行通信的不同的应用程序 1 HTTP协议代理服务器常用端口号 xff1a 80 8080 3128 8081 9098 2 SOCKS代理协议服务器常用端口号 xff1a 1080 3 FTP xff08 文件传输
  • Docker中安装MySQL5.7,并解决中文乱码问题

    Docker安装MySQL5 7 xff0c 并解决中文乱码问题 在Docker中安装5 7 一 安装常规步骤 在docker中安装软件大概就分为这几种 查询所需要的软件镜像pull镜像运行镜像 xff08 镜像变容器 xff09 查看容易
  • git失败

    提示 xff1a gnutls handshake failed The TLS connection was non properly terminated 先设置 export GIT SSL NO VERIFY 61 1 再重新git
  • 【解决办法】pip和python版本不一致

    1 查看pip的版本 pip V pip的版本是python3 5 2 查看python版本 python python 版本是3 8 可以看到pip和python的版本对不上 xff0c 怎么处理呢 xff1f 3 使用和python版本
  • CentOS7虚拟机 下 MySQL 5.7版本 在线详细安装配置、以及完全卸载教程

    x1f9e1 x1f49b x1f49a x1f499 x1f49c x1f90e x1f497 x1f9e1 x1f49b x1f49a x1f499 x1f49c x1f90e x1f497 感谢各位一直以来的支持和鼓励 xff0c 制
  • cuda11.2对应的tensorRT版本

    下载tensorRT的官网地址 xff1a https developer nvidia com nvidia tensorrt download 进去之后可以看到各种版本的tensorRT xff0c 但是没有找到只适用于cuda11 2
  • cmake———CXX_STANDARD is set to invalid value ‘17‘

    Q xff1a CXX STANDARD is set to invalid value 39 17 39 A xff1a 版本和cmake版本对不上 xff0c 进入CMakeLists txt xff0c 将set CMAKE CXX
  • 使用DiffusionDet在mot数据集上训练

    数据集处理 在https github com facebookresearch detectron2 detectron2 data datasets builtin py 中 xff0c 可以看到 xff0c detectron2中可以
  • 服务器挂载硬盘

    BuyVM Block Storage xff08 数据盘 xff09 挂载方法 垃圾站 cyhour com fdis l 可以查看硬盘 xff1a 1 找到数据盘之后 xff0c 格式化 mkfs ext4 F dev sdb 2 创建
  • setuptools:‘NoneType‘ object has no attribute ‘split‘

    问题 xff1a 运行 python m pip install e 或者 python setup py build develop 报错 anaconda3 envs querydet lib python3 7 site packag
  • Linux卸载pycharm

    1 确保pycharm程序全部关闭之后 xff0c 进入pycharm的安装目录 xff0c 默认在 opt 2 进入Pycharm的bin目录 xff08 我也不懂为什么 xff0c 或许知道的可以告诉一声 xff09 xff0c 我的是
  • Rust Web入门(一):TCP 和 HTTP Server

    本教程笔记来自 杨旭老师的 rust web 全栈教程 xff0c 链接如下 xff1a https www bilibili com video BV1RP4y1G7KF p 61 1 amp vd source 61 8595fbbf1
  • Rust Web入门(三):连接数据库

    本教程笔记来自 杨旭老师的 rust web 全栈教程 xff0c 链接如下 xff1a https www bilibili com video BV1RP4y1G7KF p 61 1 amp vd source 61 8595fbbf1
  • 如何进入 Windows 的 Ubuntu 子系统

    很久没有用这个 Ubuntu 子系统了 xff0c 最近是因为阿里云到期了 xff0c 又不打算续费 xff0c 所以才重新用起了它 记得原来直接按 Windows 43 R xff0c 输入 ubuntu 回车 xff0c 就能进入这个系
  • Git最新教程4——使用码云Gitee使用教程,创建项目仓库并上传代码

    此git栏目均有学习笔记以及相应的视频 xff0c 视频链接在最后 xff0c 学习笔记完全开源 xff1a https gitee com SiobhanMing Siobhan studyNote 目录 一 注册登录码云 xff0c 完
  • CentOS6.5 安装ntopng-1.2.0

    0 准备工作 安装libpcap xff1a 最好源码安装 yum install y libpcap 安装redis yum install y redis 1 安装 tar zxvf ntopng cd ntopng autogen s
  • Java编程题之四个数字组成不同且无重复的三位数

    题目 有1 2 3 4四个数字 xff0c 能组成多少个互不相同且无重复数字的三位数 xff1f 都是多少 xff1f span class token keyword int span count span class token ope
  • 联想笔记本摄像头被禁用

    联想笔记本摄像头被禁用 针对摄像头 xff08 相机 QQ视频 微信视频 xff09 能够正常打开 xff0c 但是不显示画面 xff0c 如果是找不到摄像头这种问题 xff0c 关了吧 xff0c 找其他的别看这个浪费时间 这种情况可能是
  • Zoom to learn, learn to zoom超分辨网络

    目录 论文主要贡献背景创新点一 SR RAW数据集创新点二 CoBi损失函数结果结论 论文 Zhang X Chen Q Ng R et al Zoom to learn learn to zoom C Proceedings of the