如果相机平移也在 Z 方向，单应性在平面场景的两个图像之间是否成立？

2024-04-27

我正在尝试计算两个图像之间的相对姿势：并且我正在使用单应性来过滤特征匹配。我有一个相当平面的场景，只要两个图像之间的平移仅限于 X 和 Y 轴（opencv 约定），基于单应性的相对姿态估计就可以非常准确地工作。

一旦我开始使用另一个相机沿 Z 方向移动（第一个相机保持不变），相对姿势估计就无法正常工作，它会继续以非常低的 Z 平移估计姿势。尽管场景是平面的，但当沿 Z 方向平移时，单应性是否不适用？

在这里附上一张图片：我将第二个相机移动到两个正方形中：一个在 XY 平面上，一个在 XZ 平面上。红十字是相机平移的实际姿势（将其视为地面实况），蓝色圆圈是通过基于单应性的 RANSAC 估计的相对姿势。请注意 X 和 Y 方向移动时的精度，以及 Z 方向上的完全失败：所有估计值都接近 z=0 平面。

我将单应矩阵分解为旋转和平移的代码取自这个 StackExchange 答案 https://dsp.stackexchange.com/a/2571/25498

void cameraPoseFromHomography(const Mat& H, Mat& pose)
{
    pose = Mat::eye(3, 4, CV_64FC1); //3x4 matrix
    float norm1 = (float)norm(H.col(0)); 
    float norm2 = (float)norm(H.col(1));
    float tnorm = (norm1 + norm2) / 2.0f;

    Mat v1 = H.col(0);
    Mat v2 = pose.col(0);

    cv::normalize(v1, v2); // Normalize the rotation

    v1 = H.col(1);
    v2 = pose.col(1);

    cv::normalize(v1, v2);

    v1 = pose.col(0);
    v2 = pose.col(1);

    Mat v3 = v1.cross(v2);  //Computes the cross-product of v1 and v2
    Mat c2 = pose.col(2);
    v3.copyTo(c2);      

    pose.col(3) = H.col(2) / tnorm; //vector t [R|t]
}

这准确吗？单应性矩阵的第三列是否编码完整的 3D 翻译？

尽管场景是平面的，但当沿 Z 方向平移时，单应性是否不适用？

如果你有一个平面场景all它的图像使用透视相机（无镜头畸变）将与以下关系相关：同形异义词。这与相机是否旋转或翻译。
如果存在明显的镜头畸变，则图像将不会通过同形异义相关。
如果场景是非平面的，那么图像将通过以下方式关联仅当没有镜头畸变且没有相机平移（仅旋转）时才单应性。

相对位姿估计无法正常工作，它一直以非常低的 Z 平移来估计位姿

使用单应性分解计算的 3D 平移是符合比例的。这意味着返回的平移向量t两个相机之间的平移与真实平移存在比例因子的差异s。很遗憾s是不可恢复的。通常，单目图像的 3D 重建称为metric为此原因进行重建（而不是欧几里得解决了真实比例的重建）。解决s还需要更多信息，例如了解平面上某个点的深度或相机在图像之间移动的距离。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ComputerVision

homography

如果相机平移也在 Z 方向，单应性在平面场景的两个图像之间是否成立？的相关文章

准确测量一组基准点之间的相对距离（增强现实应用）

假设我有一组 5 个标记我正在尝试使用增强现实框架找到每个标记之间的相对距离例如AR工具包 http www hitl washington edu artoolkit 在我的相机中前 20 帧仅向我显示前 2 个标记以便我可以计算
如何从旋转矩阵计算角度

我使用单个对象的两个图像该对象从第一个图像旋转一定角度我计算了每个图像的姿势并使用 Rodergues 将旋转向量转换为矩阵现在我如何计算并查看它从第一个位置旋转了多少我尝试了很多方法但答案是否定的编辑我的相机是固定的只有
图像增强使性能变得更差[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在研究一个图像分割项目并一直在尝试采用图像增强技术来增加训练集的大小起初我只是尝试使用水平翻转将图像尺寸放大一倍但我发现性
图像上沿折线/曲线的点的有序列表

我有一些带有折线多重曲线组合的图像我的目标是恢复沿着这些折线多重曲线的点的有序列表使用 opencv ConnectedComponents 我可以隔离图像中的每条折线曲线然后尝试通过以下步骤获取有序的点序列 num label
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
OpenCV 与 Python 错误 - 二进制操作中断言失败 ((mask.type() == CV_8UC1 || mask.type() == CV_8SC1))

我正在尝试在网络摄像头源上覆盖图像这是代码的主要部分 Load our overlay image glasses png imgGlasses cv2 imread 1 png Create the mask for the glass
提高 SURF 在小图像上的性能

我在网络上遇到的每个 SURF 实现似乎都特别不擅长从小图像例如 100x100 或更小中提取有用数量的兴趣点我尝试了多种方法 1 使用各种放大算法从简单的最近邻算法到更高级的算法基本上每个放大器 imagemagick 都提供
YOLO 目标检测：算法如何预测大于网格单元的边界框？

我试图更好地理解 YOLO2 和 3 算法的工作原理该算法处理一系列卷积直到达到13x13网格然后它能够对每个网格单元内的对象以及这些对象的边界框进行分类如果您查看这张图片您会发现红色边框比任何单个网格单元都大边界框也以对象的
如何旋转图像以对齐文本以进行提取？

我正在使用 pytesseract 从图像中提取文本但它不适用于倾斜的图像考虑下面给出的图像这是提取文本的代码它在不倾斜的图像上运行良好 img cv2 imread
opencv边界框问题

我有一个图像需要在周围绘制一个边界框我正在尝试使用本文底部的代码我遇到的问题是我尝试模糊蓝色框形状以删除其细节例如 cv2 blur img 20 20 但模糊图像似乎没有足够好的边缘来生成边界框我发现如果我将下面的代码与具有与下
3D 空间中的激光投影仪校准

我正在研究一种在现实世界中校准激光投影仪的解决方案该项目有几个目标 1 Take in a minimum of four points measured in the real world in 3d space that repres
使用高斯混合模型进行皮肤检测

我正在根据以下进行皮肤检测算法本文 http www cc gatech edu rehg Papers SkinDetect IJCV lowres pdf 第 21 页有两个模型高斯皮肤混合模型和非皮肤颜色模型第一个皮肤检测模型效果
在 iPad 上使用 OpenCV 避免碰撞

我正在开展一个项目需要使用 OpenCV 实现碰撞避免这是在 iOS 上完成的 iOS 5 及以上版本即可项目目标这个想法是将 iPad 安装在汽车仪表板上并启动应用程序应用程序应该从相机中抓取帧并进行处理以检测汽车是否会与任何
将四边形（四边形）拟合到斑点

应用不同的过滤和分割技术后我最终得到如下图像我可以访问一些轮廓检测函数这些函数返回该对象边缘上的点列表或者返回一个拟合的多边形尽管有很多边远多于 4 个我想要一种将四边形适合该形状的方法因为我知道它是应该是四边形的鞋盒的正面
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
在 RGB 图像上绘制多类语义分割透明叠加

我有语义分割掩码的结果值在 0 1 之间需要大津阈值来确定什么是积极的我想直接在 RGB 图像上绘制在 RGB 图像上每个预测类具有不同的随机颜色我使用以下内容绘制了具有单一颜色的单个蒙版是否有一个包或简单的策略可以为多类别做到
指纹奇异点检测

我正在尝试确定指纹的核心点和增量点我正在使用庞加莱指数方法但我无法成功检测到这一点而且我不明白为什么 First I divide the image in 15x15 blocks then I calculate the x an
归一化互相关的基础知识

我正在尝试使用范数校正2 归一化互相关 http en wikipedia org wiki Cross correlation Normalized cross correlation 来自 MATLAB 用于计算发育中胚胎中移动形状的速
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
如何确定与视频中物体的距离？

我有一个从行驶中的车辆前面录制的视频文件我将使用 OpenCV 进行对象检测和识别但我停留在一方面如何确定距已识别物体的距离我可以知道我当前的速度和现实世界的 GPS 位置但仅此而已我无法对我正在跟踪的对象做出任何假设我计划用

随机推荐

为什么 Google 使用内联 JavaScript 和 CSS？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何通过 CSharp 以编程方式设置输入元素的值？

你好我正在尝试让 IE 自动登录网站但问题是输入元素没有 HTML ID 属性例如
Grid.Mvc.Ajax扩展网格初始化

您好我对使用 JQuery 和 Ajax 的 Web GUI 开发非常陌生我正在尝试让 nuget 包 Grid MVC Ajax 正常工作自述文件指出以下内容 Follow thse steps to use Grid Mvc Aj
Eclipse CDT 内置包含目录

Under Eclipse CDT gt Project Settings gt C C General gt Paths and Symbols gt Includes gt GNU C 有一个包含路径的列表有些是粗体的并且是特定于项目
迁移到 Qt6/PyQt6：Qt5 中所有已弃用的短格式名称是什么？

我正在尝试从以下位置迁移代码库PyQt5 to PyQt6 我读过这篇文章参见https www pythonguis com faq pyqt5 vs pyqt6 https www pythonguis com faq pyqt5 v
一个电子邮件地址中可以有多少个@符号？

是否有任何规则要求在任何电子邮件 ID 中包含指定数量的符号如果我们要使用 PHP 检查电子邮件 ID 是否有效我就会想到如果引用多个被允许我必须问你为什么需要这些信息拜托拜托please不要尝试编写正则表达式函数或其他任何
最好的分布式暴力对抗措施是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案首先有一点背景知识众所周知我正在为 CodeIgniter 实现一个 auth auth 系统并且到目前为止我正在获胜可以这么说但我
请解释为什么以及如何 +new Date();在 IE8 或更低版本中作为 Date.now() 的“解决方法”

我正在看书面向 Web 开发人员的专业 JavaScript 给出有关此问题的背景信息特别是有关引用类型的第 5 章我想知道为什么以及如何var start new Date 用于获取 now 的当前毫秒表示作为不支持 ECMASc
从 Google AppEngine 切换到另一台服务器

目前我正在 Google AppEngine GAE 上构建我的 Java Web 应用程序但由于它们有很多限制我担心我必须从 GAE 切换到运行 Glassfish 或如果需要我可以设置任何其他服务器我还计划运行 Oracle
为什么我不能返回通用“T”来满足 Partial？

我用 TypeScript 写了一些代码 type Point x number y number function getThing
所有原始包装类都是不可变对象吗？

Java 中的所有原始包装类都是不可变对象吗字符串是不可变的其他不可变对象是什么 Any type which doesn t give you any means to change the data within it is imm
使用 Bash 比较 PHP 版本号？

我有这个脚本应该确保用户当前的 PHP 版本在某个范围内尽管它应该可以工作但某个地方有一个错误使它认为版本超出范围有人可以看一下并告诉我我能做什么来解决它 function version echo gawk F printf d
SVG 元素绕圆旋转

所以我有一个 SVG 元素大圆圈和里面的一组元素我想围绕这个大圆圈旋转这些元素代码非常简单但我已经开始担心如何在正确的路径大圆圈上设置这个圆圈 graph skils 正如您在下面的链接中看到的这个小圆圈在大圆圈上旋转不正确
调试严重的 SIGILL 崩溃：文本段损坏

我们的系统是基于 PowerPC 的运行 Linux 的嵌入式系统我们遇到了随机的 SIGILL 崩溃这种情况在各种应用程序中都会出现崩溃的根本原因是将要执行的指令归零这表明内存中的文本段已损坏由于文本段是以只读方式加载的因此应
openpyxl 图表误差线样式

我被分配了一项简单的任务即将一系列数据列收集到结果工作簿中结果工作簿包含分析结果所需的公式和图表这些数据是由我用 python 编写的图像分析应用程序生成的作为一系列 Excel 工作簿现在的问题是 openpyxl 会删除
如何验证当前用户 ASP.net mvc Identity

当用户访问我的网站时他们会看到登录页面一旦他们成功登录他们就可以注销并且其他用户可以登录但是如果用户在登录时单击后退按钮则会转到登录页面此时新用户无法再登录我收到防伪令牌错误我尝试注销任何进入登录页面的用户我尝试过不同的
在 CodeIgniter 会话中存储具有相同名称的多个输入

我已经发布了这个在 CodeIgniter 论坛中 http codeigniter com forums viewthread 155508 并且也耗尽了论坛搜索引擎所以如果交叉发帖不被允许我们深表歉意本质上我有一个输入设置为
如何将基于 Qt4.6 Phonon 的媒体应用程序移植到 Qt 5.1？

我有一个基于 Qt 4 6 的应用程序它使用 QtWebView 加载带有标签的 HTML 页面以便在 Windows 平台上播放网络多媒体源我没有使用默认的 PHONON 播放引擎而是构建了另一个 PHONON 后端引擎来处理媒体
帮助手册中的锚点不起作用

我已经仔细检查了所有内容希望有人能发现我没有看到的愚蠢错误我正在尝试为我的应用程序构建一个 Apple 帮助部分它可以正确地转到登录页面但是没有一个锚点起作用登陆页面称为index html另一个页面称为test html它位于p
如果相机平移也在 Z 方向，单应性在平面场景的两个图像之间是否成立？

我正在尝试计算两个图像之间的相对姿势并且我正在使用单应性来过滤特征匹配我有一个相当平面的场景只要两个图像之间的平移仅限于 X 和 Y 轴 opencv 约定基于单应性的相对姿态估计就可以非常准确地工作一旦我开始使用另一个相机沿 Z

如果相机平移也在 Z 方向，单应性在平面场景的两个图像之间是否成立？

如果相机平移也在 Z 方向，单应性在平面场景的两个图像之间是否成立？ 的相关文章

随机推荐

热门标签

如果相机平移也在 Z 方向，单应性在平面场景的两个图像之间是否成立？的相关文章