视频稳像(Video Stabilization)

一般来讲,由于连续视频两帧图像之间相隔较短,所以相邻的两帧图像大部分内容是相同的,基于这种假设,两帧图像之间的相对运动可以分解为,大部分场景的全局运动和小部分场景的局部运动,而全局运动一般代表着摄像机的主观运动。图3-1示意了相邻两帧图像的全局运动与局部运动,四个小圆圈的平移代表了整幅图像的全局运动,而中间的小三角的运动则代表了局部运动。

由于摄像载体的不稳定,导致在连续的帧间全局运动出现了抖动,如图3-2所示。图中小圆圈在连续帧间上下起伏的运动轨迹就是由全局运动受到抖动干扰后形成的。视频稳像算法就是要保证得到正确的全局运动矢量,而消除掉抖动对于全局运动的影响。

运动模型

由于图像的运动方式各不相同,可采用不同的运动模型来表示。对于相邻的两帧图像,常从平移、旋转和缩放等方面来考虑两者的相对变化。图3-5表示了第T帧图像与第T+1帧图像之间的平移、旋转和缩放变化。

如果图像只有平移运动,那么使用平移模型：

其中p1、p0分别是当前帧和参考帧中对应的坐标，T是二维平移量。当图像具有平移旋转和缩放的变化时,运动模型为：

其中T是二维平移矢量,s是变焦系数,。Re是正交的旋转矩阵。即为

当图像具有扭转变化时,需要使用6参数的模型才可以表示扭转的变化

针对于视频稳像技术而言,由于相邻两帧图像的间隔很短,几乎没有扭转变化,所以一般采用平移、旋转加缩放的模型对其运动进行建模。

电子稳像

经典的电子稳像包含3个步骤：

1. 全局运动估计

2. 运动补偿

3. 图像生成

全局运动一般指的是视频中背景的运动。在做全局运动估计时，一个难点是如何获得准确的运动信息，排除局部运动等各种干扰的影响。主要途径有微分方法和特征点对应法。

运动补偿是指对全局运动进行修正，使主观运动与抖动分离，是视频稳像的实质所在。如图1所示其目标是生成平滑的运动。运动补偿分为2 类：

1. 基于参数滤波；基于参数滤波是指把描述运动的参数看成需要的主观运动和加性抖动的叠加，采用一定的滤波方法使得加性噪声运动被抑制，如采用概率模型的Kalman 滤波。

2. 基于轨迹平滑。基于轨迹平滑则将摄像机的运动轨迹看成带噪声的运动轨迹，采用相应的平滑方法来去除高频噪声。

图像生成是稳定算法的后续阶段，其目标是根据补偿后的运动生成稳定视频输出流，涉及到图像拼接、去模糊、融合等技术。相对简单的实现是输出与输入帧一对一变换，如图2所示。在这种模式下，输出视频时会出现空白区域。许多学者也研究了如何保持图像精度（全帧输出）。通常的方法是通过相邻帧的拼接来获得全帧输出，其缺点是可能会使得拼接区域过渡不连续、不自然。在图像生成时另一个思路是把这个过程看成一个渲染生成的过程，其思想是综合图像信息，在此基础上根据特定的约束和一定的准则生成图像，而不是局限于图像的一一对应关系。如图3所示，该方法不是一对一的图像变换，而是基于一个子序列。将子序列送渲染系统，经过插值、融合等操作，生成不同视点的输出序列。这种方法的优点是生成的视频序列信息更全，也有更好的连贯性与视觉效果。

补充：

根据算法中运动估计方式的不同，数字稳像可分为2D稳像算法和3D稳像算法。

1. 2D稳像算法通过估计相邻帧图像间的平移、旋转、缩放等参数来确定运动矢量。这些参数计算了在二维空间内图像之间的变化，将图像内所有点旳运动方式设定为仅在平面上的移动。2D算法的模型比较简单，对于大部分运动情况比较简单的视频可以成功得到稳定的输出结果。2D算法鲁棒性较高，而且容易达到实时处理的要求。但是2D算法无法解决视频中普遍存在的视差问题，也无法计算出图像运动的深度信息以得出理想的摄像头运动路径。视差就是从有一定距离的两个点上观察同一个目标所产生的方向差异，图1.1为视差示意图。

2. 3D算法利用多帧图像数据构建3D点云，经过数据分析可以计算深度信息，并针对图像中不同区域的运动方式差异釆取不同的补偿方式，以解决视差产生的问题。3D稳像利用丰富的视频信息，可以达到较为理想的稳像效果并模拟合适的摄像头运动路径，但3D算法运算量较大，比较难以达到实时处理要求，而且鲁棒性略差。在后处理方式中3D算法优势明显。

说明：以上内容均摘抄自下列3篇文章中，仅用于学术交流。

陈启立, 宋利, 余松煜. 视频稳像技术综述[J]. 电视技术, 2011, 35(7):15-17.

赵菲. 视频稳像技术研究[D]. 国防科学技术大学, 2007.

李棱铱. 基于块匹配和局部子空间的视频稳像方法研究[D]. 大连理工大学, 2015.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

视频稳像(Video Stabilization) 的相关文章

毕业设计-基于深度学习的细菌微生物目标检测系统系统 YOLO python 目标检测人工智能卷积神经网络机器学习

目录前言设计思路一课题背景与意义二算法理论原理 2 1 CBAM模块 2 2 损失函数三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析实现效果图样例最后前言大四是整个大学期间最忙碌的时光一
文档扫描与矫正-仿射变换

图像变换是计算机视觉和图像处理中的关键技术之一它允许我们对图像进行各种形式的变形调整和校正其中仿射变换是一种常见的变换方式在文档扫描过程中由于拍摄角度和畸变等原因文档图像可能存在一定程度的形变仿射变换可以用于校正文档图像使
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
socket网络编程几大模型？看看CHAT是如何回复的？

CHAT回复网络编程中常见的有以下几种模型 1 阻塞I O模型 Blocking I O 传统的同步I O模型一次只处理一个请求 2 非阻塞I O模型 Non blocking I O 应用程序轮询调用socket相关函数检查请求不需
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
无人机视角、多模态、模型剪枝、国产AI芯片部署

无人机视角多模态模型剪枝国产AI芯片部署是当前无人机技术领域的重要研究方向其原理和应用价值在以下几个方面进行详细讲述一无人机视角无人机视角是指在无人机上搭载摄像头等设备通过航拍图像获取环境信息并进行图像处理和分析这种技术
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金

随机推荐

shell指令，通过函数实现数组求和，通过函数获取用户uid和gid

一实现一个对数组求和的函数数组通过实参传递给函数 num 0 read p 请输入一组数据 a arr function add for i 0 i lt arr i do num arr i done return num add a
CSS中如何实现文字描边效果（Text Stroke）？

聚沙成塔每天进步一点点专栏简介文字描边效果 Text Stroke 示例写在最后专栏简介前端入门之旅探索Web开发的奇妙世界记得点击上方或者右侧链接订阅本专栏哦几何带你启航前端之旅欢迎来到前端入门之旅这个专栏是为那些对
手把手接入【微信测试公众号】，不会还有人不会调试公众号吧？

仅使用微信的测试公众号 Java开发内容遇错与参考 Java接入测试微信公众号调试流程前提创建并配置测试号登陆注册微信测试公众号沙箱微信验签免登授权获取用户信息微信接口调试工具的使用创建服务号菜单常见错误 invalid
最高月薪15K! 这个30岁的奶茶店老板说：这次转行，转对了！

人生没有一成不变的风景这一路上我们会走过晴天也会踏过泥泞会穿越风雨也将沐浴暖阳不同的年龄有不同的风景不同的阶段有不同的境遇也许每个人的经历不同对人生的感受也各异但只要内心强大不断让自己淬炼成长就能从容面对人生行
Yii Framework 开发教程(47) 主题 Theme 示例

Theming是一个在Web应用程序里定制网页外观的系统方式通过采用一个新的主题可以非常方便的改变应用的外观在Yii 每个主题由一个目录代表包含view文件 layout文件和相关的资源文件如图片 CSS文件 JavaScript
1、安装配置

一安装这里以Redis 5 0 5版本为例实际安装过程中可以去官网下载最新的稳定版本官网地址 http redis io download wget http download redis io releases redis 5
内核启动过程中对CPU型号的确认

1 内核为什么要确认CPU型号内核和CPU都是不断发展的内核会不断的更新版本 CPU会不断的出新型号每当厂商推出一款新的CPU都需要移植内核使内核能在新款CPU上运行如果我们将没有针对该款CPU移植过的内核放到该款CPU上运行结
Linux定时器

Linux定时器的实现主要用到itimerval结构体以及setitimer产生的信号系统随使用signal信号处理函数来处理产生的定时信号从而实现定时器 itimerval结构体说明 struct itimerval Value to
[谦实思纪 02]整理自2023雷军年度演讲——《成长》（下篇）创业之旅（创业与成长）

文章目录谦实思纪整理自2023雷军年度演讲成长下篇创业之旅创业与成长 0 写在前面 1 创业创业与成长 1 1 找互补的朋友一起干更容易成功 1 2 创业中必须要有领导者核心思维 1 3 从失败开始学海无涯 1 4 金山
STM32G070进行flash读写操作

STM32G070的flash读写问题 STM32G070xx的flash分布如下图打算将Page 63用于保存用户数据问题开始一直出现flash写入失败从返回码来看是FLASH FLAG PGSERR 一直找不到原因代码如下 d
android throw exception 原理,Android Throw Exception

It depends if this Close can throw an exception then it still needs to be declared as being thrown or caught Often times
grid常用属性及属性值介绍

文章目录前言一 grid布局是什么二常用简写必会 2 1 grid 2 2 gap grid gap 2 3 grid area 2 4 grid template 2 5 place content 2 6 place item
1359: [Baltic209]Candy

题目链接题目大意 tan90 题解不存在的我的收获如何快速升级
protobuf与protoc-gen-go

什么是protobuf Protobuf Protocol Buffer 是google 的一种数据交换的格式它独立于语言独立于平台 google 提供了多种语言的实现 java c c go 和 python 每一种实现都包含了相应语
Jmeter接口测试+压力测试

jmeter是apache公司基于java开发的一款开源压力测试工具体积小功能全使用方便是一个比较轻量级的测试工具使用起来非常简单因为jmeter是java开发的所以运行的时候必须先要安装jdk才可以 jmeter是免安装的
OkHttp的使用之{RequestBody、FormBody、MultipartBody}

目录 0 相关文章 1 POST请求 1 1 RequestBody json数据提交 1 2 FromBody 表单提交这种能满足大部分的需求 1 3 MultipartBody 文件上传 1 4 图片下载文件下载 0 相关文章 Ok
布隆过滤器（Bloom Filter）

1 引言通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景一般想到的是将集合中所有元素保存起来然后通过比较确定链表树散列表又叫哈希表 Hash table 等等数据结构都是这种思路但是随着集合中元素的增加我们需要的
线程相关面试题

1 ThreadPoolExecutor 线程池执行有哪些常用的方法 1 执行线程池 submit excute 2 终止线程池 shutdown 3 判断线程是否终止 isShutdown 4 获取正在运行的线程数 getAcitive
详解Python中字符串前“b”,“r”,“u”,“f”的作用

1 字符串前加 u 例 u 我是含有中文字符组成的字符串作用后面字符串以 Unicode 格式进行编码一般用在中文字符串前面防止因为源码储存格式问题导致再次使用时出现乱码 2 字符串前加 r 例 r n n n n 表示一个普通
视频稳像(Video Stabilization)

原文 https blog csdn net hjl240 article details 52683738 开源关键词 Video Stabilization 不错 https github com yaochih awesome vi

视频稳像(Video Stabilization)

视频稳像(Video Stabilization) 的相关文章

随机推荐

热门标签