Parallax-tolerant Image Stitching - 解决大视差图片拼接的方法

2023-05-16

Paper name

Parallax-tolerant Image Stitching

Paper Reading Note

URL: http://web.cecs.pdx.edu/~fliu/papers/cvpr2014-stitching.pdf

TL;DR

该篇文章作为13年EG的seam-driven stitching的改进版，作者提出新的发现是基于seam-driven的方式在一定程度上不需要两张待拼接图片被完全对齐，某些关键part被对齐后基于seam-driven的方式也可以获取视觉观感很好的拼接图片。于是作者提出了新的对齐效果评估方式、similarity transformation与content-preserving warping进一步提升对大视差场景的拼接效果

Introduction

现有的seam cuting和blending方法难以解决由于视差较大、场景景深差异大影响的拼接图像严重不对齐问题
spatially-varying warping算法相比于使用单个homography可以更好解决视差问题，但是在极大视差下依然不work，如下图所示的hard case，第一张待拼接图中的水平几何关系是卡车->烟筒->树，但是第二张待拼接图中的水平几何关系是卡车->树->烟筒，在这种情况下待拼接图像需要被折叠后才能与另一张图像进行对齐，这对于warping方式来说是很难的
作者认为在图像拼接任务中并不需要完全使overlap区域的像素点完全对齐，而只需要在待拼接图像的overlap区域中找到一个局部区域使得两张图片能够较好拼接起来，作者成这种方式为local stitching

Dataset/Algorithm/Model/Experiment Detail

实现方式

作者认为实现较好的拼接效果需要同时考虑到Homography与content-preserving warping，Homography可以保持图像全局几何信息但是难以解决视差问题；content-preserving warping可以更好解决视差问题，但无法较好保持图像几何关系
但是在大视差场景下，使用一个较好对齐的Homography与局部区域的对齐质量是两个有冲突的目标，作者提出了一种粗对齐然后基于content-preserving warping方式来改善对齐效果

1. 对齐模型选择

两种流行的对齐方案
- 全局的2D变换，通常称为Homography
- spatially-varying warping，比如content-preserving warping
作者结合这两个方法来进行图像对齐，首先选择一个种子特征点，逐渐增加种子特征点周围的特征点来拟合一个2D的变换，作者使用一个较大的拟合阈值来尽量包含周围更多的特征点，这虽然会使得两图的特征点无法完全对齐，但是后续的content-preserving warping方法会一定程度修复这个问题

2. 对齐质量评估

一种直接的拼接质量评估方法是首先使用homography对待拼接图像进行warp操作，然后实施content-preserving warping，通过对比warp后的图片与参考图片来评估图片是否良好拼接，但是该方法速度较慢，因为每次评估都需要进行content-preserving warping这样的耗时操作
作者提出了一种评估对齐质量的方式：
- 对输入的待拼接图片进行边缘信息提取（Canny边缘检测方法），低通滤波用于容忍较小的不对齐现象
- 计算warp图片与ref图片的边缘差异能量图，基于Graphcut算法搜索出一条最优拼缝，graphcut实施的具体方式是将overlap区域的边缘差异能量图的每个像素都作为一个图节点，然后基于以下边缘损失搜索最优的拼缝：
最优Homography搜索
- 一些homography会达到seamless的拼接，但是会引起图片中部分part严重变形的情况，通过检测perspective distortion来确定选出来的由部分特征点拟合的H与全局最优的H的差别，找到与全局最优的H最拟合的单应变换矩阵

3. 对齐算法细节

在这里插入图片描述

作者所提出的整套拼接算法细节：

检测并匹配SIFT特征，生成edge maps；
随机选取一个特征点，然后组合近邻的特征点搜索出一个最佳的homography，对于已经被选取过的特征点会增加惩罚项使得之后的选取过程中不容易被重复选取；
评估基于步骤2得到的最佳的homography的拼接效果，如果符合预先设定质量评估阈值，则进行步骤4，否者返回步骤二重新选择最佳的homography，实在搜索不到符合阈值的情况就选择一个上述重复进行第二步所得到的最佳homography；
基于上述得到的最佳homography进行初步对齐，然后使用基于特征点指导的content-preserving warping来进行精对齐

content-preserving warping的细节
- 仅使用content-preserving warping一般无法很好对齐所有的overlap区域，所以content-preserving warping一般用于在初对齐步骤后进行精对齐
- content-preserving warping的主要是将整图warping问题转换为mesh warping问题，mesh warping被定义为一个优化问题，目标是将初对齐的结果进一步对齐到ref图片上，用于避免可察觉的抖动，作者定义了Local alignment term，Global alignment term，Smoothness term作为优化目标：

实验结果

与经典的Photoshop, AutoStitch, as-projective-as-possible stitching(APAP)等方法比起来对大视差场景有更好的效果

Thoughts

作者提出了一种新的对齐方式来解决大视差问题，除非视差很大并且overlap区域中都是salient目标时，一般都能较好完成拼接
该方法提出的最优homography搜索以及content-preserving warping两个步骤就需要消耗cpu20-40s的处理时间，在实时拼接上的应用价值还有待探索

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Parallax

Tolerant

image

Stitching

解决大视差图片拼接的方法

Parallax-tolerant Image Stitching - 解决大视差图片拼接的方法的相关文章

我应该如何使用 jcrop 在客户端裁剪图像并上传？

我正在开发一个包含文件上传 HTML 控件的组件在使用文件上传元素选择图像后该图像将呈现在 HTML5 Canvas 元素上这是带有示例代码的 JSFiddle https jsfiddle net govi20 spmc7ymp h
Phonegap 图像未显示

我无法让图像在我的phonegap 版本中正常工作我读过绝对路径可能不起作用所以我尝试了绝对路径和相对路径但仍然没有运气我包括这样的图像
调整回形针大小以适合矩形框

我有一个矩形图像例如 30x800 像素如何用回形针缩放它以保留 100x100 像素图像的纵横比并用边框填充空白区域一个例子 http www imagemagick org Usage thumbnails pad extent
在 Android 版 Glide 中离线时加载已获取的图像

我正在使用 Glide 版本 4 8 0 为了加载图像我这样做 GlideApp with HomePageFragment this load remoteURL diskCacheStrategy DiskCacheStrategy A
iOS - 基于设备的不同图像或缩放相同的图像？

似乎开发人员总是为不同的设备创建不同的图像资源并根据设备加载它们但是只为最高分辨率的设备 iPad 创建图像然后为 iPhone 6 5 等缩小该图像有什么缺点吗我使用 SpriteKit 因此我只需创建不同大小的 SKSpri
图像未显示在从 HTML 创建的 PDF 上

我想动态创建 PDF 这意味着我将从 Google Drive 获取文件然后将它们放入 HTML 代码中并尝试从中创建 PDF 一切工作正常除了图像没有显示我现在正在做的是从 HTML 字符串创建 HtmlOutput 获取该 H
在 Python 中倾斜数组

我有一个 2D 数组我将使用它保存为灰度图像scipy misc toimage 在此之前我想将图像倾斜给定角度像这样进行插值scipy ndimage interpolation rotate 上图只是为了说明倾斜过程我知道我必须
如何使用javascript检查图像url是否为404

使用案例当 src 不为空并且 alt 标签不为空时则显示 src 的图像然后检查 src 图片 url 不是 404 当 src 为空且 alt 不为空时显示名字的图像当 src 和 alt 为空时显示默认图像 HTML img
在 Android 上将大位图文件的大小调整为缩放的输出文件

我的文件中有一个大位图例如 3888x2592 现在我想将该位图大小调整为 800x533 并将其保存到另一个文件中我通常会通过调用来缩放位图Bitmap createBitmap方法但它需要一个源位图作为第一个参数我无法提供它
滚动效果：先慢后快

我正在尝试创建滚动效果当onclick事件被触发我想要那个div1滚动到dev2 一开始应该慢然后快这是一个使用此效果的网站 http community saucony com kinvara3 http community sa
在TImageViewer中，如何获取用户点击图片的位置？

在TImageViewer控件中用户可以缩放或平移图片我的问题是当用户点击图片时如何获取用户在图片上的点击位置尤其是用户可以对图片进行放大缩小或平移之后如何获取对应的图片点击位置呢 As shown below How to
如何使用 JMagick 转换色彩空间？

如何使用 JMagick API 转换色彩空间例如 CMYK gt RGB 和 RGB gt CMYK None
在所有浏览器中启用我的网站的平滑滚动

我正在开发一个视差滚动网站Stellar http markdalgleish com projects stellar js and Skrollr https github com Prinzhorn skrollr图书馆该网站在 F
如何在PHP中将图像从内存上传到AWS S3？

所以我目前有一个使用 AWS S3 上传图像的上传系统这是代码 Upload image to S3 s3 Aws S3 S3Client factory array key gt mykey secret gt myskey try s
React App 中的图像损坏

我正在尝试访问 React 应用程序中的图像当我运行代码时我在网页上看到一个损坏的图像图标我不确定我是否正在访问图像的正确路径我的代码如下 import React Component from react class Header
Java .drawImage：如何“取消绘制”或删除图像？

我需要在程序运行时不断在不同位置重绘某个图像因此我设置了一个 while 循环该循环应该在屏幕上移动图像但它只是一遍又一遍地重新绘制图像我究竟做错了什么有没有办法在将旧图像绘制到新位置之前删除旧图像 JFrame frame b
保存为 HDF5 的图像未着色

我目前正在开发一个将文本文件和 jpg 图像转换为 HDF5 格式的程序用HDFView 3 0打开似乎图像仅以灰度保存 hdf h5py File Sample h5 img Image open Image jpg data np
如何提高包含大量小图像的 UCollectionView 的性能？

在我的 iOS 应用程序中我有UICollectionView显示大约 1200 个小 35x35 点图像图像存储在应用程序包中我正确地重用了UICollectionViewCell但仍然存在性能问题具体取决于我处理图像加载的方式
下载后从谷歌照片库检索图像

我正在发起从图库中获取照片的意图当我在图库中使用 Nexus 谷歌照片应用程序时一切正常但如果图像不在手机上在 Google Photos 在线服务上它会为我下载选择图像后我将图像发送到另一个活动进行裁剪但在下载的情况下发
将签名位图转换为签名字符串（很奇怪的一个）

基本上我需要将位图图像转换为字符串但这不是常见的困境在于该字符串由两部分组成 1 积分 2 线路我需要将图像转换为由分隔的两个部分我得到的一个例子是 221A 221A270A270A25032503200720071716171

随机推荐

使用android 视频解码mediaCodec碰到的几个问题

问题1 mediaCodec dequeueInputBuffer一直返回 1 xff0c APP现象 xff1a 视屏卡屏原因 xff1a 这是因为inputbuffer的内容有误 xff0c 导致无法解码可通过设延时时间解决 xff
云计算思维导图

根据近期的云计算学习心得 xff0c 将云计算部分内容制作成思维导图 xff0c 方便于广大云计算学习者作为辅导讲义 xff01 思维导图内容主要包含 xff1a 1 云计算概述 2 云体系结构 3 网络资源 4 存储资源 5 硬件介绍 6
路由器重温——串行链路链路层协议积累

对于广域网接口来说 xff0c 主要的不同或者说主要的复杂性在于理解不同接口的物理特性以及链路层协议 xff0c 再上层基本都是 IP 协议 xff0c 基本上都是相同的 WAN口中的serial接口主要使用点对点的链路层协议有 xff0c
路由器重温——PPPoE配置管理-2

四配置设备作为PPPoE服务器路由器的PPPoE服务器功能可以配置在物理以太网接口或 PON 接口上 xff0c 也可配置在由 ADSL 接口生成的虚拟以太网接口上 1 配置虚拟模板接口虚拟模板接口VT和以太网接口或PON接口绑定后
Python入门自学进阶——1--装饰器

理解装饰器 xff0c 先要理解函数和高阶函数首先要明白 xff0c 函数名就是一个变量 xff0c 如下图 xff0c 定义一个变量名和定义一个函数 xff0c 函数名与变量名是等价的既然函数名就是一个变量名 xff0c 那么在定义函
Python入门自学进阶-Web框架——21、DjangoAdmin项目应用

客户关系管理以admin项目为基础 xff0c 扩展自己的项目一创建项目二配置数据库 xff0c 使用mysql数据库 xff1a 需要安全mysqlclient模块 xff1a pip install mysqlclient D
Python入门自学进阶-Web框架——33、瀑布流布局与组合查询

一瀑布流 xff0c 是指页面布局中 xff0c 在显示很多图片时 xff0c 图片及文字大小不相同 xff0c 导致页面排版不美观如上图 xff0c 右边的布局 xff0c 因为第一行第一张图片过长 xff0c 第二行的第一张被挤到第
Python入门自学进阶-Web框架——34、富文本编辑器KindEditor、爬虫初步

KindEditor 是一个轻量级的富文本编辑器 xff0c 应用于浏览器客户端一首先是下载 xff1a http kindeditor net down php xff0c 如下图下载后是解压缩后 xff1a 红框选中的都可以删除
Python入门自学进阶-Web框架——35、网络爬虫使用

自动从网上抓取信息 xff0c 就是获取相应的网页 xff0c 对网页内容进行抽取整理 xff0c 获取有用的信息 xff0c 保存下来要实现网上爬取信息 xff0c 关键是模拟浏览器动作 xff0c 实现自动向网址发送请求 xff0c
6、spring的五种类型通知

spring共提供了五种类型的通知 xff1a 通知类型接口描述Around 环绕通知org aopalliance intercept MethodInterceptor拦截对目标方法调用Before 前置通知org springfram
路由器接口配置与管理——1

路由器的接口相对于交换机来说最大的特点就是接口类型和配置更为复杂 xff0c 一般吧路由器上的接口分为三大类 xff1a 一类用于局域网的LAN接口 xff0c 一类用于广域网接入互联的WAN接口 xff0c 最后一类可以应用于LAN组网
路由配置与管理——静态路由配置与管理

静态路由是一种最简单的路由 xff0c 需手工配置 xff0c 用一条指令指定静态路由的目的IP地址子网掩码下一跳IP地址 xff0c 或者出接口优先级等主要参数值就可以了还可根据实际需要配置静态路由与BFD或者NQA的联动一路
TCP实现局域网通信

TCP实现局域网通信 TCP客户端通信步骤 xff1a 1 xff1a 创建套接字 sockfd 61 socket AF INET SOCK STREAM 0 2 xff1a 填写服务器结构体信息 span class token key
路由策略和策略路由配置与管理-1

路由策略和策略路由配置与管理路由策略与策略路由之间的区别就在于它们的主体 xff08 或者说作用对象 xff09 不同 xff0c 前者的主体是路由 xff0c 是对符合条件的路由 xff08 主要 xff09 通过修改路由属性
IP组播基础及工作原理——1

IP组播在一些多用户定向发送的网络应用中使用非常普遍 xff0c 如远程多媒体会议远程教学视频点播定向电子商务 xff0c 以及ISP的IPTV xff08 网络电视 xff09 等学好IP组播基础知识及配置与管理方法 xff0c
IP组播配置与管理实战——1

IGMP 配置与管理 IGMP xff08 InternetGroup Management Protocol xff0c 因特网组管理协议 xff09 是TCP IP 协议族中负责IPv4组播成员管理的协议 xff0c 需要在组播组成
Linux:利用返回值传出参数，地址传递，值传递,使用回调函数赋值几个例程。

利用返回值传出参数 xff0c 地址传递 xff0c 值传递使用回调函数赋值几个例程代码 xff1a include lt stdlib h gt include lt stdio h gt include lt unistd h gt
一步一步实现多尺度多角度的形状匹配算法(C++版本)

前言用过halcon形状匹配的都知道 xff0c 这个算子贼好用 xff0c 随便截一个ROI做模板就可以在搜索图像中匹配到相似的区域 xff0c 并且能输出搜索图像的位置 xff0c 匹配尺度 xff0c 匹配角度现在我们就要利用op
查看麒麟操作系统版本

root 64 tbase01 nkvers Kylin Linux Version Release Kylin Linux Advanced Server release V10 Tercel Kernel 4 19 90 23 8 v2
Parallax-tolerant Image Stitching - 解决大视差图片拼接的方法

Paper name Parallax tolerant Image Stitching Paper Reading Note URL http web cecs pdx edu fliu papers cvpr2014 stitching