图像超分辨率及相关知识 简介

2023-11-07

初学者可能往往会把图像分辨率和超分辨率搞混淆,先来看一下他们的概念。

1.分辨率

图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做像素每英寸。一般情况下,图像分辨率越高,图像中包含的细节就越多,信息量也越大。图像分辨率分为空间分辨率和时间分辨率。通常,分辨率被表示成每一个方向上的像素数量,例如64*64的二维图像。但分辨率的高低其实并不等同于像素数量的多少,例如一个通过插值放大了5倍的图像并不表示它包含的细节增加了多少。图像超分辨率重建关注的是恢复图像中丢失的细节,即高频信息。
在大量的电子图像应用领域,人们经常期望得到高分辨率(简称HR)图像。但由于设备、传感器等原因,我们得到的图像往往是低分辨率图像(LR)。
增加空间分辨率最直接的解决方法就是通过传感器制造技术减少像素尺寸(例如增加每单元面积的像素数量);另外一个增加空间分辨率的方法是增加芯片的尺寸,从而增加图像的容量。因为很难提高大容量的偶合转换率,所以这种方法一般不认为是有效的,因此,引出了图像超分辨率技术。

2.图像超分辨率

图像超分辨率(Image Super Resolution)是指由一幅低分辨率图像或图像序列恢复出高分辨率图像。图像超分辨率技术分为超分辨率复原和超分辨率重建。目前, 图像超分辨率研究可分为 3个主要范畴: 基于插值、 基于重建和基于学习的方法。
超分辨率(Super-Resolution)即通过硬件或软件的方法提高原有图像的分辨率,通过一系列低分辨率的图像来得到一幅高分辨率的图像过程就是超分辨率重建。超分辨率重建的核心思想就是用时间带宽(获取同一场景的多帧图像序列)换取空间分辨率,实现时间分辨率向空间分辨率的转换。

3.与其他图像处理技术的关系

图像修复技术与图像超分辨率技术比较: 图像修复的目标是恢复一个被模糊或者噪声破坏的图像,但是它不改变图像的尺寸。事实上图像修复和SR复原在理论是完全相关的,超分辨率技术可以看作是第二代图像修复技术,主要区别是图像修复技术在处理后图像中的像素数并不增加。
图像插值与图像超分辨率的比较: 图像插值,即增加单幅图像的尺寸。一般的插值并不能恢复LR采样过程中丢失的高频信息,但是图像超分辨率可以,因此图像插值方法不能被认作是SR技术。
图像锐化与图像超分辨率的比较: 图像锐化可以提升高频信息,但仅增强已有的高频成分;超分辨率技术能估计出原始图像中没有表现出来的高分辨率细节。
图像拼接与图像超分辨率的比较: 图像拼接虽然将多幅图像结合成更大的图像,包含了更多的像素,但没有提供更多的细节信息,所以不能算是超分辨率技术。

4.技术分类

A.所处领域

(1)基于频域的方法
主要是傅里叶变换及其逆变换。由于图像细节是通过高频信息反映出来的,所以消除低分辨率图像里的频谱混叠就可以获得更多被掩盖掉的高频信息,从而增加图像细节,提高图像的分辨率。
优点:原理清晰,理论推导方便,计算复杂度较低;
缺点:只适用于空间不变噪声的情况,只能处理图像中仅有整体运动而没有局部运动的情况,难于在处理过程中利用先验信息。
(2)基于空域的方法
空域的方法常利用图像局部的信息进行,增加像素的数量和紧密程度,从而增加图像细节,提高图像的分辨率。
优点:种类多,可将各种退化因素综合考虑,灵活性强;
缺点:设计复杂,计算复杂度较高。

B.根据所用低分辨率图像的数量

(1)基于单幅图像的超分辨率(SISR)
输出是单幅图像。 包含:图像放大(图像尺寸或像素的增加)、超分辨率复原(利用点扩散函数和目标的先验知识,在图像系统的衍射极限之外复原图像信息)。
(2)基于多幅图像的超分辨率(MISR)
输出的可以是单幅图像也可以是一个图像系列(常为视频)。其基本前提是通过同一场景可以获取多幅LR细节图像,每一幅LR图像都会为HR图像的复原提供一些不同的信息,如果能够合成这些HR图像,那么SR图像复原是可以实现的。

C.根据技术本身的特点

(1)基于重建的超分辨率
基于重建的超分辨率复原方法是对图像的获取过程建立观测模型,然后通过求解观测模型的逆问题来实现超分辨率重建。观测模型描述了成像系统从高分辨率场景 (图像)获取低分辨率观测图像的过程。
从本质上讲,利用单幅或多幅LR观测图像获取HR观测图像是求解观测问题的逆问题,它是一个病态反问题。
关键步骤:配准、重建。 配准是将多幅同一场景的LR图像在空间上进行亚像素精度对齐, 得到高低分辨率图像彼此之间的运动偏移量, 构建观测模型中的空间运动参数。重建是采用不同的先验约束条件 (平滑性、非负性和能量有限性等) 和最优化求解方法进行HR图像的求解。
典型方法:非均匀插值法、迭代反投影法、最大后验概率法(目前实际应用和科学研究中运用最多的一种方法)、凸集投影法。
(2)基于学习的超分辨率
借助预先的训练学习(从数据库)来寻找或建立低分辨率图像与其对应的高分辨率图像之间的映射关系,提取高频信息,从而在给定低分辨率图像的情况下,通过优化方法获得相应的高分辨率图像。
浅层学习:特征提取–>学习–>重建
深度学习:特征提取–>非线性映射–>图像重建

参考链接:
https://blog.csdn.net/qin605/article/details/70185795

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

图像超分辨率及相关知识 简介 的相关文章

  • 交叉编译tslib (正确版)

    1 下载安装交叉编译器 编译器版本不限 需要与系统移植时的编译器保持一致即可 2 下载tslib1 4 3 交叉编译tslib 1 4 下载的tslib 1 4 tar gz放到 home driver ts 目录下 cd home dri
  • 手写算法-Python代码实现非线性回归

    手写算法 Python代码实现非线性回归 生成非线性数据集 1 用线性回归拟合 2 多项式拟合 sklearn实现 校验系数的结果 总结 生成非线性数据集 前面我们介绍了Python代码实现线性回归 今天 我们来聊一聊当数据呈现非线性时 这
  • 嵌入式监控【v4l2采集->vpu编码->live555推流】

    嵌入式监控 v4l2采集 gt vpu编码 gt live555推流 文章目录 嵌入式监控 v4l2采集 gt vpu编码 gt live555推流 介绍 数据流图 一 v4l2 1 1 确定cam的输出格式 1 2 YUYV 转 YUV4
  • 【机器学习系列】如何将多条ROC曲线画在一张图里,并解决文本遮挡问题

    有的时候我们需要将ROC曲线输出在同一张图中 这样可以更加直观地对比模型 并且我们常常会遇到在图形中有文字相互遮挡的问题 我们可以用adjustText中的adjust text来实现文本不相互遮挡并添加箭头的功能 定义多条roc曲线画图函
  • 股票交易系统的服务器,股标交易传输系统

    本词条缺少概述图 补充相关内容使词条更完整 还能快速升级 赶紧来编辑吧 股标交易传输系统在Windows 环境下将原有的传输和显示系统进行改进 使它们在 Windows 环境下可以并发执行 而且可以和其它应用 程序协调地共享资源 这不仅实现
  • 基于labview实现MYSQL数据库查询功能

    前言 labview是一款功能强大的图形化编程软件 也就是俗称的G语言 本篇将介绍如何利用labview对MYSQL进行列表分页 范围查询及模糊查询等几个可广泛应用的简易功能 但事实上labview并不擅长处理数据库 下面详细代码可体现 数
  • spring-boot,java 微服务,跨域配置

    只需要在启动类下面与run方法同级加上下面那串代码即可 public static void main String args SpringApplication run ApplicationService class args Over
  • Visual Studio 2019中使用Qt,步骤详解

    本文学习的目的就是在Visual Studio 2019环境下能够顺利的运行Qt程序 下面是一些具体的配置安装过程 首先 打开visual Studio 2019 继续但无需代码 如图 然后点击扩展 管理扩展 在搜索框中搜索Qt 点击下载插
  • 上个厕所的功夫,就把定时任务的三种调度策略说得明明白白

    Spring Task 无疑是 Spring 环境下单机定时任务的首选 它用起来非常简单 功能也够用 Spring Task 有三种模式 分别是 fixedDelay cron 和 fixedRate 话不多说 我们先看代码 Slf4j C
  • JUC多线程及高并发

    文章目录 1 对volatile的理解 2 CAS 3 原子类AtomicInteger的ABA问题 原子更新引用 4 ArrayList线程不安全的案例 5 公平锁 非公平锁 可重入锁 递归锁 自旋锁 6 CountDownLatch C
  • SpringBoot支付宝沙箱支付步骤

    步骤1 注册一个沙箱号 网站https open alipay com platform home htm 使用自己真实的支付宝扫描进去 进行注册沙箱支付宝 步骤2 下载密匙生成工具 下载完毕 解压 双击运行 网址 https opendo
  • 重磅:国产IDE发布,由阿里研发,完全开源!​(高性能+高定制性)

    经历近 3 年时间 在阿里集团及蚂蚁集团共建小组的努力下 OpenSumi 作为国内首个强定制性 高性能 兼容 VS Code 插件体系的 IDE 研发框架 今天正式对外开源 1 OpenSumi 是什么 OpenSumi 是一款面向垂直领
  • Lua点号和冒号区别

    定义的时候冒号默认接收self参数 调用的时候冒号默认传递调用者自己为参数 而句号要显示传递或接收self参数 例如 句号定义 需要显示传递或接收 plain view plain copy a x 1 function a fun sel
  • Python画QQ图检验正态分布

    import numpy as np import seaborn as sns import matplotlib pyplot as plt from statsmodels graphics api import qqplot sns
  • pip 安装 sklearn or scikit-learn python3

    安装 sklearn 1 安装 numpy scipy matplot pip3 install numpy scipy matplotlib i https pypi tuna tsinghua edu cn simple 2 安装 sk

随机推荐

  • Android序列化:Serializable Parcelable

    Android序列化完全解析 一 Java Serializable http http www jianshu com p fcc59fb523b6 Android序列化完全解析 二 Parcelable http www jianshu
  • 背对背mos管开关_10天电子入门-MOS管

    1 MOS管介绍 在各大IT企中我们把场效应管 FET 统称为MOS管 其作用是把输入电压的变化转化为输出电流的变化 FET的增益等于它的跨导 定义为输出电流的变化和输入电压变化之比 市面上常有的一般为N沟道和P沟道 它属于电压控制型半导体
  • uni-app 之 解决u-button始终居中问题

    uView中u button始终居中问题如何解决的简单方法 1 给该元素margin right 0 可以达到向右靠齐 2 给该元素的父元素设置float right image png
  • DF-GAN: A Simple and Effective Baseline for Text-to-Image Synthesis论文解读

    题目 DF GAN 一种简单有效的文本 图像合成基线 时间 2022 CVPR Abstract 从文字描述中合成高质量的逼真图像是一项具有挑战性的任务 现有的文本 图像生成对抗网络通常采用堆叠架构作为主干 但仍存在三个缺陷 首先 分层结构
  • open3d,读取stl/ply/obj/off/gltf/glb三维模型,并转换成点云,保存

    1 三维模型获取 可以自己用建模软件建立一个模型 本案例使用模型的下载地址 可以从free3d免费下载 无需注册 2 导入open3d import open3d as o3d 3 open3d模型读取与可视化 模型路径 支持后缀 stl
  • vim编辑器-设置默认行号和高级用法

    vim 自动显示行号 编辑 etc vim vimrc文件 在最后加上两句 完事ok 注 set nu 显示行号 set tabstop 4 设置缩进 set nonumber取消行号 set nu set tabstop 4 vim的高级
  • SpringBoot2为什么默认使用CGLib不再使用JDK动态代理

    SpringBoot2为什么默认使用CGLib不再使用JDK动态代理 CGLib和JDK动态代理对比 1 不需要实现接口 2 性能 3 代理对象的创建 4 调用方法 2 CGLib使用 CGLib和JDK动态代理对比 1 不需要实现接口 J
  • hadoop 配置history server 和timeline server

    一 配置history server 1 配置history server 在etc hadoop mapred site xml中配置以下内容 span style font size 18px span style font size
  • python工程师-Python工程师学习之旅

    1 Python软件开发基础 1 Linux操作系统2 Docker基础3 Python基础语法4 Python字符串解析5 Python正则表达式6 Python文件操作7 Python 模块8 Python异常9 python GUI编
  • 施密特触发器的作用-摘录+自解

    波形变换 可将三角波 正弦波 周期性波等变成矩形波 脉冲波的整形 数字系统中 矩形脉冲在传输中经常发生波形畸变 出现上升沿和下降沿不理想的情况 可用施密特触发器整形后 获得较理想的矩形脉冲 脉冲鉴幅 幅度不同 不规则的脉冲信号施加到施密特触
  • Opencv 视频帧的读写处理指导

    Opencv 视频帧的读写指导 思路指导 1 先打开视频文件 2 遍历视频帧 3 处理视频帧 4 保存所有的视频帧 1 打开视频 1 当读取的是保存的视频时 打开视频的方法为 cv VideoCapture capture 视频名 将视频放
  • el-tree处理树形结构的穿梭框问题(后台返回平级数据 / 文末附项目Git地址)

    作者简介 一个每天中午去打篮球和锻炼的前端开发 两只猫 和一只狗的铲屎官 微博 GuoJ阝阝 fu 文章目录 前言 一 分析需求 二 使用步骤 1 引入库 2 页面文件代码 3 功能函数代码 4 引入的javaScript文件的代码 三 项
  • 计算机网络笔记、面试八股(四)—— TCP连接

    本章目录 4 TCP连接 4 1 TCP报文段的首部格式 4 2 TCP连接如何保证可靠 4 3 ARQ协议 4 3 1 停止等待ARQ协议 4 3 1 1 无差错情况 4 3 1 2 出现差错情况 4 3 1 3 确认丢失和确认迟到 4
  • 机器学习——最简单的回归——一元线性回归(基于python3.9和sklearn)

    最近学 聚类 学累了 学一学高中生都会的一元线性回归吧 高中的时候都学过 从一堆离散的点集提取出一个看起来很符合点分布的曲线 即研究输出关于输入的函数映射关系 回归问题的学习过程等价于拟合过程 选择一条曲线使得其能够较良好地拟合数据点的分布
  • Node.js全网最详细教程(Node.js Web 模块)

    Node js Web 模块
  • IDEA修改项目名称出现中括号

    疑问1 修改项目名称 却出现中括号 分析 项目的名称有day08修改成day09 却出现了中括号 现在中括号里的day08其实是model的名字 而day09是文件的名字 要去掉中括号就必须使model名和文件名一致 所以这里修改model
  • 如何用计算机计算概率,概率统计计算

    概率统计计算 又称计算概率统计 是概率论 数理统计 计算数学和计算机科学等学科之间的一个交叉性 边缘性 应用性的学科分支 中文名 概率统计计算 外文名 The calculation of probability and statistic
  • SQL注入之报错注入的一些随笔

    0x00 序言 关于报错注入的话虽然我在我之前的文章里面写了一些 但是sql注入的姿势实在是太多了 之前写过的payload不全也不系统 今天抽出时间来总结一下 ps 关于报错注入的原理和使用的基本函数我在我之前的文章 SQLI LABS修
  • SQL实战19.查找所有员工的last_name和first_name以及对应的dept_name

    题目 解答 多表外联结 select e last name e first name de dept name from employees as e left join dept emp as d on e emp no d emp n
  • 图像超分辨率及相关知识 简介

    初学者可能往往会把图像分辨率和超分辨率搞混淆 先来看一下他们的概念 1 分辨率 图像分辨率指图像中存储的信息量 是每英寸图像内有多少个像素点 分辨率的单位为PPI Pixels Per Inch 通常叫做像素每英寸 一般情况下 图像分辨率越