Python 使用新的相机位置创建图像

2024-01-31

我现在正在努力完成一项特定的计算机视觉任务。例如，假设我们有一个道路的相机框架。现在我想用水平平移的假想相机生成一个新帧。此外，还添加了一个微小的摄像角度。为了说明这一点，我上传了一张演示图片：

如何在 python 中从原始框架创建新框架？对于我的其他计算机视觉任务，我已经在使用 OpenCV。

我也为此苦苦挣扎了一段时间，直到我看到这篇有用的帖子 https://stackoverflow.com/questions/23920729/compute-homography-for-a-virtual-camera-with-opencv/23951677#23951677分享一些示例代码。我理论上理解，如果你有单应矩阵，你可以使用 OpenCV 的 warpPerspective 函数获得新的框架。由于您拥有精确的平移和旋转值，因此您可以根据相机的内在参数自行推导矩阵。然而直到我自己尝试了代码，我才完全明白它是如何完成的。

我们知道，对于空间中的 3D 点到 2D 图像的投影，单应性矩阵由下式给出

H = K[R|T]

要将点从一个 2D 图像转换为另一个图像，您只需先将点反向投影到 3D，然后将它们重新投影到新的图像平面。

x’ = K * [R2|T2] * [R1|T1](inv) * K(inv) * x

[R2|T2] * [R1|T1](inv) 相当于单个变换矩阵，它给出从一个相机位姿到另一个相机位姿的相对变换。所有矩阵通过在需要的地方附加 [0, 0, 0, 1] 形成 4x4。

以下是一些示例代码，这些代码改编自同一篇文章的代码。

import cv2
import numpy as np

f = 500
rotXval = 90
rotYval = 90
rotZval = 90
distXval = 500
distYval = 500
distZval = 500

def onFchange(val):
    global f
    f = val
def onRotXChange(val):
    global rotXval
    rotXval = val
def onRotYChange(val):
    global rotYval
    rotYval = val
def onRotZChange(val):
    global rotZval
    rotZval = val
def onDistXChange(val):
    global distXval
    distXval = val
def onDistYChange(val):
    global distYval
    distYval = val
def onDistZChange(val):
    global distZval
    distZval = val

if __name__ == '__main__':

    #Read input image, and create output image
    src = cv2.imread('test.jpg')
    src = cv2.resize(src,(640,480))
    dst = np.zeros_like(src)
    h, w = src.shape[:2]

    #Create user interface with trackbars that will allow to modify the parameters of the transformation
    wndname1 = "Source:"
    wndname2 = "WarpPerspective: "
    cv2.namedWindow(wndname1, 1)
    cv2.namedWindow(wndname2, 1)
    cv2.createTrackbar("f", wndname2, f, 1000, onFchange)
    cv2.createTrackbar("Rotation X", wndname2, rotXval, 180, onRotXChange)
    cv2.createTrackbar("Rotation Y", wndname2, rotYval, 180, onRotYChange)
    cv2.createTrackbar("Rotation Z", wndname2, rotZval, 180, onRotZChange)
    cv2.createTrackbar("Distance X", wndname2, distXval, 1000, onDistXChange)
    cv2.createTrackbar("Distance Y", wndname2, distYval, 1000, onDistYChange)
    cv2.createTrackbar("Distance Z", wndname2, distZval, 1000, onDistZChange)

    #Show original image
    cv2.imshow(wndname1, src)

    k = -1
    while k != 27:

        if f <= 0: f = 1
        rotX = (rotXval - 90)*np.pi/180
        rotY = (rotYval - 90)*np.pi/180
        rotZ = (rotZval - 90)*np.pi/180
        distX = distXval - 500
        distY = distYval - 500
        distZ = distZval - 500

        # Camera intrinsic matrix
        K = np.array([[f, 0, w/2, 0],
                    [0, f, h/2, 0],
                    [0, 0,   1, 0]])

        # K inverse
        Kinv = np.zeros((4,3))
        Kinv[:3,:3] = np.linalg.inv(K[:3,:3])*f
        Kinv[-1,:] = [0, 0, 1]

        # Rotation matrices around the X,Y,Z axis
        RX = np.array([[1,           0,            0, 0],
                    [0,np.cos(rotX),-np.sin(rotX), 0],
                    [0,np.sin(rotX),np.cos(rotX) , 0],
                    [0,           0,            0, 1]])

        RY = np.array([[ np.cos(rotY), 0, np.sin(rotY), 0],
                    [            0, 1,            0, 0],
                    [ -np.sin(rotY), 0, np.cos(rotY), 0],
                    [            0, 0,            0, 1]])

        RZ = np.array([[ np.cos(rotZ), -np.sin(rotZ), 0, 0],
                    [ np.sin(rotZ), np.cos(rotZ), 0, 0],
                    [            0,            0, 1, 0],
                    [            0,            0, 0, 1]])

        # Composed rotation matrix with (RX,RY,RZ)
        R = np.linalg.multi_dot([ RX , RY , RZ ])

        # Translation matrix
        T = np.array([[1,0,0,distX],
                    [0,1,0,distY],
                    [0,0,1,distZ],
                    [0,0,0,1]])

        # Overall homography matrix
        H = np.linalg.multi_dot([K, R, T, Kinv])

        # Apply matrix transformation
        cv2.warpPerspective(src, H, (w, h), dst, cv2.INTER_NEAREST, cv2.BORDER_CONSTANT, 0)

        # Show the image
        cv2.imshow(wndname2, dst)
        k = cv2.waitKey(1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 使用新的相机位置创建图像的相关文章

嵌套函数中的变量作用域

有人可以解释为什么以下程序失败 def g f for in range 10 f def main x 10 def f print x x x 1 g f if name main main 带有消息 Traceback most re
如何使用 tkinter 使用网格功能显示不同的图像？

我想使用显示文件夹中的图像grid 但是当我尝试使用以下代码时我得到了迭代单个图像的输出 My code def messageWindow win Toplevel path C Users HP Desktop dataset for
MacOS Big Sur 中的 NPM 错误“找不到 Python 可执行文件”

我已经花了整整一周的时间寻找这个问题的答案但没有成功我查看了每个 StackOverflow 帖子 Google 的每一篇文章以及我能找到的每个相关的 Github 问题大多数相关错误似乎都比较旧所以我想知道我的问题是否由于我使用的
如何使用 Pycharm 运行 fast-api 服务器？

我有一个简单的 API 函数如下所示 from fastapi import FastAPI app FastAPI app get async def read root return Hello World 我正在使用启动服务器uvi
如何检查给定的数字是否是2的幂？

下面的代码不适用于某些输入 a i set 1 while i lt 10000 a add i i lt lt 1 N int input if N in a print True else print False 我最初的想法是检查每个
python win32com.client 调整窗口大小

我正在使用 Python 3 4 1 通过 win32com client 控制 Windows 应用程序我可以激活它我可以发送击键点击等现在我想知道是否有办法调整窗口大小并将其设置到特定位置我找不到方法这里有一些代码片段所以
熊猫系列到二维数组

所以我使用了来自的答案将二维数组放入 Pandas 系列中 https stackoverflow com questions 38840319 put a 2d array into a pandas series将 2D numpy
Python：处理图像并保存到文件流

我需要使用 python 处理图像应用过滤器和其他转换然后使用 HTTP 将其提供给用户现在我正在使用 BaseHTTPServer 和 PIL 问题是 PIL 无法直接写入文件流因此我必须写入临时文件然后读取该文件以便将其发
如何在使用 Flask for Python 3 的同时使用 Bootstrap 4？

我检查过发现默认安装时 Flask Bootstrap 原生使用 Bootstrap 3 3 7 但实际上我想通过使用 Flask Bootstrap 包在我的项目中使用 Bootstrap 4 任何有关如何更新它或类似内容的帮助将不胜感
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
PySpark DataFrame 上分组数据的 Pandas 式转换

如果我们有一个由一列类别和一列值组成的 Pandas 数据框我们可以通过执行以下操作来删除每个类别中的平均值 df DemeanedValues df groupby Category Values transform lambda g
Python：如何“杀死”类实例/对象？

我希望 Roach 类在达到一定量的饥饿时死亡但我不知道如何删除该实例我的术语可能有误但我的意思是窗户上有大量蟑螂我希望特定的蟑螂完全消失我会向您展示代码但它很长我将蟑螂类添加到策划者类蟑螂种群列表中一般来说每个
数据类和属性装饰器

我一直在阅读 Python 3 7 的数据类作为命名元组的替代品我通常在必须将数据分组到结构中时使用它我想知道数据类是否与属性装饰器兼容以便为数据类的数据元素定义 getter 和 setter 函数如果是这样是否在某处进行了描
model.predict() 返回类而不是概率

Hello 我是第一次使用 Keras 我训练并保存了一个模型作为 json 文件及其权重该模型旨在将图像分为 3 个类别我的编译方法 model compile loss categorical crossentropy optim
如何使用 QAbstractTableModel（模型/视图）将数据设置到 QComboBox？

我希望能够设置itemData of a combobox当使用填充时QAbstractTableModel 但是我只能从模型返回一个字符串data method 通常当不使用模型时可以像这样执行 Set text and data
python 中“重载”函数的最佳方法？ [复制]

这个问题在这里已经有答案了我正在尝试在 python 中做这样的事情 def foo x y do something at position x y def foo pos foo pos x pos y 所以我想根据我提供的参数数量调
将整数转换为特定格式的十六进制字符串

我是 python 新手有以下问题我需要将整数转换为 6 个字节的十六进制字符串例如 281473900746245 gt xFF xFF xBF xDE x16 x05 十六进制字符串的格式很重要 int 值的长度是可变的格式 0
如何在Python中不使用库函数将字符串转换为整数？

我正在尝试转换 a 546 to a 546 不使用任何库函数我能想到的最纯粹 gt gt gt a 546 gt gt gt result 0 gt gt gt for digit in a result 10 for d in 01
混合语言源目录布局

我们正在运行一个使用多种不同语言的大型项目 Java Python PHP SQL 和 Perl 到目前为止人们一直在自己的私有存储库中工作但现在我们希望将整个项目合并到一个存储库中现在的问题是目录结构应该是什么样的我们应该为每种
python：日志记录：我们可以向记录器添加多个过滤器吗？考虑哪一个

我试图了解 Python 日志记录中的多个过滤器一个在配置中定义另一个在代码中定义如何工作我正在开发一个 Django 项目下面是我在 settings py 中的记录器配置我的目标是switch on and switch o

随机推荐

有没有办法重命名 Keras 模型的指标和损失？

我有一个非常大的模型有很多损失和指标当我做print np array self model metrics names 我明白了 loss autoencoder loss autoencoder loss autoencoder l
错误类型错误：无法读取未定义的属性“长度”

我的这部分代码有错误 img src assets gms logo png alt website icon 但是当我检查资产文件夹时 gms logo png仍然在那里并且在angular cli json 资产也在那里路径也是正确的
Android/iOS OpenCV 眼睛扩张检测

寻找有关 OpenCV 是否可以或已经用于检测 Android 或 iOS 上的眼睛扩张的意见除了使用 OpenCV 的 EyePhone 应用程序进行眼动追踪和眨眼检测之外我没有发现太多其他功能在完美的条件下我确信这是可能的我更
Bootstrap 3 - 显示所有屏幕尺寸的折叠导航

我正在使用 Bootstrap v3 我已经设置了导航栏类这样当我的屏幕大小为移动设备大小时导航会折叠并出现类似网格的小切换按钮所以这可以按预期工作我想要的是这是所有屏幕尺寸的默认操作也就是说即使在桌面上我也希望导航折叠起来
如何从xslt中的java地图获取数据

我需要从 XSLT 中的 Java 地图获取数据我知道使用 xalan 我可以实现它但我们依赖于通用 Transformer 这迫使我们使用 Saxon HE 我将 java 映射传递给变量并在 XSLT 中获取它请建议我们如何实现这
清除或重新创建 Ruby on Rails 数据库

我有一个充满数据的开发 Ruby on Rails 数据库我想删除所有内容并重建数据库我正在考虑使用类似的东西 rake db recreate 这可能吗我知道有两种方法可以做到这一点这将重置您的数据库并重新加载当前架构 rake
选择全日历中的整周

我在使用 fullcalendar 插件时遇到了问题我试图通过单击在月视图中选择整周然后创建一个事件换句话说如果您单击特定周中的任何一天该周将突出显示并创建一个事件此后该事件应输入我的数据库中这是我到目前为止所拥有的
(w)ifstream 支持不同的编码吗

当我使用 wifstream 将文本文件读取为宽字符串 std wstring 时流实现是否支持不同的编码即它可以用于读取例如ASCII UTF 8 和 UTF 16 文件如果没有我该怎么办我需要阅读整个文件如果这有影响的话 C
空响应和未找到响应的 HTTP 状态代码

我们正在实现基于 REST 的 Web 服务并且对某些用例有一些疑问考虑有一个唯一的帐户其中包含一些信息例如添加到购物车信息如果不存在购物车信息我们应该返回什么响应代码例如 0 我们的理解是返回 200 并返回空响应用户将购
assertj：比较 dto 和实体类之间的字段

我需要比较一个DTO类及其Entity class 例如一个AddressDTO类将是 Setter Getter NoArgsConstructor AllArgsConstructor public class AddressDTO
React CRA with CSP：拒绝执行内联脚本

我已经使用以下方式建立了一个新网站Material UI 创建 React 模板 https github com mui org material ui tree master examples create react app 我添加了
agrep：只返回最佳匹配

我在 R 中使用 agrep 函数它返回匹配向量我想要一个类似于 agrep 的函数它只返回最佳匹配或者如果存在平局则返回最佳匹配目前我正在对结果向量的每个元素使用 cba 包中的 sdist 函数来执行此操作但这似乎非常多余
在 IntelliJ 中的弹出 JavaDoc 上隐藏 JetBrains 注释

有没有办法隐藏或turn off those 可用推断注释当我从方法中阅读弹出文档时如下图所示 IntelliJ IDEA 中没有设置可以禁用它 I ve 提交了请求 https youtrack jetbrains com issue
在 Elastic Beanstalk 上部署 NestJS 应用程序

我正在尝试将我的 NestJS 应用程序部署到 AWS elastic beanstalk 但没有取得任何成功有人可以一步步写下我如何实现这一目标吗完整解释我有一个带有 typeorm 的 Nestjs 应用程序但没有将其配置为与
什么允许匿名无参数委托类型不同？

已读入作为 C 3 0 中的委托和 Lambda 表达式系列文章的一部分短语高级主题无参数匿名方法匿名方法可以省略参数列表 delegate return Console ReadLine 例如这是非典型的但确实如此允许相同
RSelenium 与 Tor 在 Windows 上具有新的 RSelenium 版本

我发现 jdarrison 关于如何使用 Tor 启动这个很棒的答案RSelenium在窗户上 https stackoverflow com a 39048970 7837376 https stackoverflow com a 390
与平台特定语言相比，使用 Adobe Air/Java 编写 Web 应用程序的优点/缺点？

我需要为 Windows 和 Mac 也许还有 Linux 编写一个 Web 应用程序也可以离线工作我想知道我是否应该使用像air flash java 这样的东西优点是我只需要编写一次应用程序然而我想知道这样做是否有任何缺点而
Visual Studio 2022 未加载依赖项

升级到 Visual Studio 2022 并安装 Net 6 0 SDK 后我似乎在运行项目时遇到问题每当我打开现有项目甚至创建新项目时我都会收到以下依赖项错误如果我尝试构建项目我会收到错误错误列表中没有任何错误尝试了一些
Node.js 如何响应升级请求？

我正在处理来自 Node js http 服务器的 websocket 升级事件升级处理程序的格式为 function req socket head 如果没有资源我如何发送对此升级请求的响应目的有没有办法使用套接字对象来做到这一点
Python 使用新的相机位置创建图像

我现在正在努力完成一项特定的计算机视觉任务例如假设我们有一个道路的相机框架现在我想用水平平移的假想相机生成一个新帧此外还添加了一个微小的摄像角度为了说明这一点我上传了一张演示图片如何在 python 中从原始框架创建新框架

Python 使用新的相机位置创建图像

Python 使用新的相机位置创建图像 的相关文章

随机推荐

热门标签

Python 使用新的相机位置创建图像的相关文章