在python opengl中使用图像中的2d点获取空间中的3d点

2024-03-13

我正在尝试模拟房间中的深度相机，我的相机能够在世界中移动和旋转，并且房间被模拟为围绕 (0,0,0) 的 3d 立方体单击按钮时，我想对图像中的 N 个随机点进行采样，并获取这些点与相机的距离（“现实世界”中的距离）。到目前为止，我已经成功创建了移动相机和立方体的场景 (Example https://i.stack.imgur.com/01SGm.png)

我尝试 gluUnProject 来获取 3d 点

model_view = np.array(glGetDoublev(GL_MODELVIEW_MATRIX))
proj = np.array(glGetDoublev(GL_PROJECTION_MATRIX))
view = np.array(glGetDoublev(GL_VIEWPORT))

3d_point = gluUnProject(x,y, 0.0)

其中 x，y 是图像中像素的坐标，但是当我检查像素时我知道它们的位置（立方角），我得到的感觉像是随机结果。

我对 openGL 很陌生，所以我可能会遗漏一些东西，从数学角度来说，我想做的就是在像素坐标上应用投影和视图矩阵的逆，但这不起作用。

我在下面附上了房间模拟的代码。

提前致谢。

import pygame
from pygame.locals import *
import numpy as np
import random
from OpenGL.GL import *
from OpenGL.GLU import *
display = (800, 600)
import math

def get_cube_information():

    vertices = (
        (1, -1, -1),
        (1, 1, -1),
        (-1, 1, -1),
        (-1, -1, -1),
        (1, -1, 1),
        (1, 1, 1, ),
        (-1, -1, 1),
        (-1, 1, 1),
        )

    edges = (
        (0,1),
        (0,3),
        (0,4),
        (2,1),
        (2,3),
        (2,7),
        (6,3),
        (6,4),
        (6,7),
        (5,1),
        (5,4),
        (5,7),
        )

    surfaces = (
        (0,1,2,3),
        (3,2,7,6),
        (6,7,5,4),
        (4,5,1,0),
        (1,5,7,2),
        (4,0,3,6),
        )

    colors = (
        (1.000, 0.920, 0.000),
        (0.000, 0.860, 0.000),
        (1.000, 0.480, 0.000),
        (1.000, 1.000, 1.000),
        (0.900, 0.000, 0.000),
        (0.000, 0.000, 0.950)
    )
    return vertices, edges, surfaces, colors


def Cube():
    glBegin(GL_QUADS)

    (vertices, edges, surfaces, colors) = get_cube_information()
    for i, surface in enumerate(surfaces):
        x = 0
        color = colors[i]
        for vertex in surface:
            x += 1
            glColor3fv(color)
            glVertex3fv(vertices[vertex])


    glEnd()

    glBegin(GL_LINES)
    for edge in edges:
        for vertex in edge:
            glVertex3fv(vertices[vertex])

    glEnd()


def main():
    pygame.init()
    tx = 0
    ty = 0
    tz = 0
    ry = 0
    rx = 0
    pygame.display.set_mode(display, DOUBLEBUF|OPENGL|RESIZABLE)

    glMatrixMode(GL_PROJECTION)
    gluPerspective(45, (display[0] / display[1]), 0.1, 50.0)

    view_mat = np.matrix(np.identity(4), copy=False, dtype='float32')

    glMatrixMode(GL_MODELVIEW)
    glLoadIdentity()
    glTranslatef(0, 0, 0)
    glGetFloatv(GL_MODELVIEW_MATRIX, view_mat)
    glLoadIdentity()

    while True:
        for event in pygame.event.get():
            if event.type == pygame.QUIT:
                pygame.quit()
                quit()
            elif event.type == pygame.KEYDOWN:
                if event.key == pygame.K_ESCAPE:
                    pygame.quit()
                    quit()
                if event.key == pygame.K_a:
                    tx = 0.05
                elif event.key == pygame.K_d:
                    tx = -0.05
                elif event.key == pygame.K_w:
                    tz = 0.05
                elif event.key == pygame.K_s:
                    tz = -0.05
                elif event.key == pygame.K_RIGHT:
                    ry = 1.0
                elif event.key == pygame.K_LEFT:
                    ry = -1.0
                elif event.key == pygame.K_UP:
                    rx = -1.0
                elif event.key == pygame.K_DOWN:
                    rx = 1.0
                elif event.key == pygame.K_SPACE:
                    continue
            elif event.type == pygame.KEYUP:
                if event.key == pygame.K_a and tx > 0:
                    tx = 0
                elif event.key == pygame.K_d and tx < 0:
                    tx = 0
                elif event.key == pygame.K_w and tz > 0:
                    tz = 0
                elif event.key == pygame.K_s and tz < 0:
                    tz = 0
                elif event.key == pygame.K_RIGHT and ry > 0:
                    ry = 0.0
                elif event.key == pygame.K_LEFT and ry < 0:
                    ry = 0.0
                elif event.key == pygame.K_DOWN and rx > 0:
                    rx = 0.0
                elif event.key == pygame.K_UP and rx < 0:
                    rx = 0.0
            elif event.type == pygame.MOUSEBUTTONDOWN:
                #here I want to sample the points and return their (x,y) in the image and their distance from the camera.
                continue

        glPushMatrix()
        glLoadIdentity()
        glTranslatef(tx, ty, tz)
        glRotatef(ry, 0, 1, 0)
        glRotatef(rx, 1, 0, 0)

        glMultMatrixf(view_mat)
        glGetFloatv(GL_MODELVIEW_MATRIX, view_mat)
        glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)
        Cube()
        glPopMatrix()
        pygame.display.flip()
        pygame.time.wait(10)
main()

要找到视口上某个点的世界位置，您必须知道该点的深度值。

x 和 y 屏幕位置以及深度已转换为 [-1, 1] 范围内的标准化设备坐标。为此，必须知道视口矩形：

ndc = [2.0* x/vp_width - 1.0, 1.0 - 2.0*y/vp_height, depth*2.0 - 1.0];

归一化的设备空间坐标必须通过逆投影矩阵转换到视图空间（最后必须执行透视划分）。

通过逆视图矩阵，可以将视图空间坐标变换到世界空间。

gluUnProject https://www.khronos.org/registry/OpenGL-Refpages/gl2.1/xhtml/gluUnProject.xml为您完成所有这一切，但您必须知道片段的深度。片段的深度可以通过以下方式读取glReadPixels https://www.khronos.org/registry/OpenGL-Refpages/gl2.1/xhtml/glReadPixels.xml:

# get mouse position
x, y = pygame.mouse.get_pos()

# get the fragment depth
depth = glReadPixels(x, y, 1, 1, GL_DEPTH_COMPONENT, GL_FLOAT)

# get projection matrix, view matrix and the viewport rectangle
model_view = np.array(glGetDoublev(GL_MODELVIEW_MATRIX))
proj = np.array(glGetDoublev(GL_PROJECTION_MATRIX))
view = np.array(glGetIntegerv(GL_VIEWPORT))

# unproject the point
point = gluUnProject(x, y, depth, model_view, proj, view)
print( point )

请注意，您必须启用深度测试 https://www.khronos.org/opengl/wiki/Depth_Test否则深度缓冲区将不会被设置。这也带来了好处，前面的多边形覆盖了它们“后面”的多边形：

glEnable(GL_DEPTH_TEST)
Cube()

当然，当读取值时，必须正确设置投影矩阵和模型视图矩阵glGetDoublev(GL_PROJECTION_MATRIX)分别glGetDoublev(GL_MODELVIEW_MATRIX).

这意味着视图矩阵的读取应该在设置之后完成：

glPushMatrix()
glLoadIdentity()
glTranslatef(tx, ty, tz)
glRotatef(ry, 0, 1, 0)
glRotatef(rx, 1, 0, 0)

glMultMatrixf(view_mat)
glGetFloatv(GL_MODELVIEW_MATRIX, view_mat)

model_view = np.array(glGetDoublev(GL_MODELVIEW_MATRIX))

注意，如果对于第四个参数（model) of gluUnProject使用单位矩阵，则gluUnProject不计算世界坐标，但计算视图坐标。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在python opengl中使用图像中的2d点获取空间中的3d点的相关文章

Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem

随机推荐

安装新版本 XCode 15.0 后无法运行应用程序 XCode

我已经安装了新版本的 Xcode 15 0 此后我无法运行我的 flutter 应用程序它向我显示以下错误 Error Xcode DT TOOLCHAIN DIR cannot be used to evaluate LIBRARY S
如何矢量化在较大矩阵的子集上运行函数的代码？

假设我有以下 9 x 5 矩阵 myArray 54 7 8 1 81 7 55 0 22 5 29 6 92 9 79 4 62 2 17 0 74 4 77 5 64 4 58 7 22 7 18 8 48 6 37 8 20 7 43
C 中的释放字符串

如果我写 char a malloc sizeof char 4 a abc char b abc 我是否需要释放该内存还是由我的系统完成在您的情况下您将无法释放动态分配的内存因为您正在丢失对它的引用试试这个 include
通过 Android 共享时 Google+ 应用程序显示错误的图片

我已以编程方式将 Google 共享添加到我的应用程序中我有一组照片我将其包含在我的帖子中并使用以下代码共享 private void shareToGooglePlus Launch the Google share dialog w
Python-UDP客户端

我目前正在阅读Pythonbook https www nostarch com blackhatpython并遇到了以下示例 import socket target host 127 0 0 1 target port 80 creat
LD_PRELOAD __libc_start_main 的 Makefile

我想做的事情很简单当我启动猫鼬服务器时我想创建一个额外的线程来完成一些额外的工作为了做到这一点我想我需要LD PRELOAD the libc start main服务器的 This is spec hooks cpp typede
与邮递员的 CORS

这个问题已经被问过几次了但我还是不明白当我读到有关的答案时没有 Access Control Allow Origin 标头问题它说应该在请求的服务器上设置一个设置以允许跨域 add header Access Control A
适用于 Windows 的 Composer 安装 -

所以我尝试在我的 Windows 操作系统上安装 Composer 并设置 Laravel 但是当我运行安装时我不断收到相同的错误首先我选择了 php exe 因为它从目录中询问C wamp bin php php5 4 16 我单击
JIT 编译的代码驻留在哪里？

所以我有这个方法用Java编写 public void myMethod int y int x 5 y doSomething x 并假设我的应用程序多次调用此函数当在Java虚拟机上运行该方法的编译代码时 JVM将首先解释该方法然
如何使用 IF EXIST 条件检查目录或文件是否存在？

如何检查目录或文件是否存在IF EXIST健康状况 Such as If exist C Windows OR C Windows2 rem Do something else rem Something else 我该怎么做简单例子1
应该在带花括号的 return 语句中调用哪个构造函数？

考虑以下代码 struct NonMovable NonMovable default NonMovable const NonMovable default NonMovable NonMovable delete NonMovable
调度程序 BeginInvoke 语法

我一直在尝试遵循一些 WCF 数据服务示例并具有以下代码 private void OnSaveCompleted IAsyncResult result Dispatcher BeginInvoke gt context EndSaveC
元素可以有结束标签吗？

我的同事并不真正了解或理解 html 她的工作是向 CMS 输入信息我注意到她一直关闭她 hr 像这样的标签 hr 我有谷歌但我找不到任何地方说这是不允许的或可能会导致问题我知道它应该是 hr 但值得我告诉她还是这是不必要但有效的标记
Apollo重新获取不重新渲染组件

我正在使用 graphql 从网络服务获取数据我的客户端代码是这样的 import React Component from react import Platform StyleSheet Text ActivityIndicator
React - 加载外部脚本的问题

我正在从事我的第一个 React 项目并且对 JS 有点陌生我正在努力解决一个非常基本的问题我想知道调试这个的最佳实践是什么我确实创建了我的应用程序create react app我没有成功加载外部脚本令人惊讶的是到目前为止我
Aiohttp、Asyncio：运行时错误：事件循环已关闭

我有两个脚本 scraper py 和 db control py 在 scraper py 我有这样的东西 def scrape category field pages search use proxy proxy file loop
JavaScript YUI3 使用全局变量？

我不知道如何从 YUI3 中更新全局变量考虑以下代码 window myVariable data one var yuiWrap YUI use node function Y console log window myVariable
Spring - 如何正确使用@Autowired来防止controller / MockMvc为空？

我正在尝试运行一些单元测试并遇到一个问题我确信该问题源于对自动装配的误解我有一个单元测试类我正在尝试使用 Autowired在 MockMvc 和 REST 控制器上两者最终都为 null 我看到一些消息来源试图解释为什么会发生这种
局部变量和寄存器变量可以声明为 extern 吗？

我一直想知道是否可以在本地声明 extern 和寄存器变量如果可以的话会受到什么限制在某些情况下局部变量可以声明为 extern 让我们来读一下C99 N1256标准草案 http www open std org JTC1 SC2
在python opengl中使用图像中的2d点获取空间中的3d点

我正在尝试模拟房间中的深度相机我的相机能够在世界中移动和旋转并且房间被模拟为围绕 0 0 0 的 3d 立方体单击按钮时我想对图像中的 N 个随机点进行采样并获取这些点与相机的距离现实世界中的距离到目前为止我已经成功创建了

在python opengl中使用图像中的2d点获取空间中的3d点

在python opengl中使用图像中的2d点获取空间中的3d点 的相关文章

随机推荐

热门标签

在python opengl中使用图像中的2d点获取空间中的3d点的相关文章