详细了解 openCV aruco 标记检测/姿态估计：亚像素精度

2024-01-26

我目前正在研究openCV的'aruco'模块，特别关注ArUco标记和AprilTags的poseEstimation。

在研究子像素精度时，我遇到了一种奇怪的行为，如下代码所示：如果我确实提供了“完美”校准（例如，cx/cy 等于图像中心并且失真设置为零）和具有已知边缘长度的“完美”标记，则 cv.detectMarkers 仅在旋转位于0/90/180 或 270 度。子像素例程为其他方向生成一个（几乎）恒定值，但处于“移位”级别。很明显，在 0/90/180/270 度的特定角度下，角落中的像素会产生急剧的过渡，因此可以高精度检测。然而，我很难找出所有其他情况下被低估的长度的根源。这是一个错误还是由某些三角函数造成的？ --> 查看下面脚本生成的图表：位姿错误是由角点检测错误造成的。因此，检测精度将取决于代码的方向。

我还检查了 ArUco 标记和不同的子像素化方法。尽管“峰”之间的角度行为会发生变化，但“峰”仍然存在。

我非常确定，这不是由于与标记旋转相关的插值，因为我也可以在实际数据中观察到相同的行为（但请注意，峰值的“高度”似乎在某种程度上取决于插值方法。您可以通过更改 cv.warpAffine 中的标志（例如更改为 cv.INTER_LINEAR）来测试此方法。

我的问题是：

峰值是由于错误造成的还是这是预期的行为？
如果是后者，你能帮我理解为什么吗？
有没有办法消除这种精度的方向依赖性（除了提高系统的分辨率，不需要子像素化）？

编辑：请注意，AprilTag 函数最近才添加到 openCV 中，因此您需要升级到某些标准存储库尚未提供的最新版本。你可以。 G。在 conda-forge 上获取最新版本。 /编辑

# -*- coding: utf-8 -*-

import numpy as np
import cv2 as cv
import pylab as plt

""" generate an "ideal" calibration with zero distortion and perfect alignment 
    of the main optical axis: """
cam_matrix = np.array([[1.0e+04, 0.00000000e+00, 1.22400000e+03],
       [0.00000000e+00, 1.0e+04, 1.02400000e+03],
       [0.00000000e+00, 0.00000000e+00, 1.00000000e+00]])
dist_coeffs = np.array([[0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.],
       [0.]])

# define detection parameters
marker_length = 30.00 # some arbitrary value
marker_length_px = 700
marker_id = 3
dictionary = cv.aruco.getPredefinedDictionary(cv.aruco.DICT_APRILTAG_16H5)
para = cv.aruco.DetectorParameters_create()
para.cornerRefinementMethod = cv.aruco.CORNER_REFINE_APRILTAG
para.aprilTagDeglitch = 0           
para.aprilTagMinWhiteBlackDiff = 30
para.aprilTagMaxLineFitMse = 20
para.aprilTagCriticalRad = 0.1745329201221466 *6
para.aprilTagMinClusterPixels = 5  
para.maxErroneousBitsInBorderRate = 0.35
para.errorCorrectionRate = 1.0                    
para.minMarkerPerimeterRate = 0.05                  
para.maxMarkerPerimeterRate = 4                  
para.polygonalApproxAccuracyRate = 0.05
para.minCornerDistanceRate = 0.05

marker_length_list = []
tvec_z_list = []

# generate pictures (AprilTag ID: 3 centered in image will be rotated by fixed angular steps, e. g. 10 degrees) 
degrees_list = np.linspace(0,350,36, dtype=np.int).tolist()
marker = cv.aruco.drawMarker(dictionary, marker_id, marker_length_px)
img = np.zeros((2048, 2448), np.uint8)+255
img[674:1374, 874:1574] = marker
cv.imshow("Original", img)
cv.imwrite("original.png", img)
rows, cols = img.shape

for entry in degrees_list:
    # rotate original picture
    rot_mat = cv.getRotationMatrix2D((((rows-1)/2),(cols-1)/2), entry, 1)
    rot_img = cv.warpAffine(img, rot_mat, (cols, rows), flags=cv.INTER_CUBIC) # interpolation changes the "peak amplitude" e.g. try cv.INTER_LINEAR instead 
    # detect marker and get pose estimate
    corners, ids, rejected = cv.aruco.detectMarkers(rot_img,dictionary,parameters=para)
    my_index = ids.tolist().index([marker_id])
    fCorners = corners[my_index]
    fRvec,fTvec, _obj_points = cv.aruco.estimatePoseSingleMarkers(fCorners, marker_length, cam_matrix, dist_coeffs)
    # calculate the respective edge length for each side
    L1 = abs(np.sqrt(np.square(fCorners[0][0][0]-fCorners[0][1][0])+np.square(fCorners[0][0][1]-fCorners[0][1][1])))
    L2 = abs(np.sqrt(np.square(fCorners[0][0][0]-fCorners[0][3][0])+np.square(fCorners[0][0][1]-fCorners[0][3][1])))
    L3 = abs(np.sqrt(np.square(fCorners[0][2][0]-fCorners[0][1][0])+np.square(fCorners[0][2][1]-fCorners[0][1][1])))
    L4 = abs(np.sqrt(np.square(fCorners[0][2][0]-fCorners[0][3][0])+np.square(fCorners[0][2][1]-fCorners[0][3][1])))
    mean_length = (L1+L2+L3+L4)/4
    # append results
    marker_length_list. append(mean_length)
    tvec_z_list.append(fTvec[0][0][2])
        
plt.figure("TVEC Z")
plt.plot(degrees_list, tvec_z_list, "go--")
plt.xlabel("marker rotation angle (°)")
plt.ylabel("TVEC Z (units of length)")

plt.figure("Mean marker length (should be 700)")
plt.plot(degrees_list, marker_length_list, "bo--")
plt.xlabel("marker rotation angle (°)")
plt.ylabel("marker length (pixels)")

EDIT2：根据 Christoph Rackwitz 的建议，以下是脚本生成的图片形式的输出：

Marker length: Should ideally be 700:

Marker distance: Should be invariant of rotation:

回答者克里斯托夫·拉克维茨 https://stackoverflow.com/users/2602877/christoph-rackwitz (看评论 https://stackoverflow.com/questions/60286600/understanding-opencv-aruco-marker-detection-pose-estimation-in-detail-subpixel/75374960#comment129380095_60286600):

您得到的像素差异仅为 2%（长度为 30 ppm， Z 中为 30 ppm）。 warpAffine 使用定点数学，5 个小数位。还有：三次插值。还有：角点细化方法（即希望适用于边缘，而不是角落）...这就是全部发生在“线性色彩空间”（warpaffine）中。如果你给了这个真实图片，这些是伽玛映射的，网络摄像头应用锐化过滤器，所以你会得到更疯狂的结果

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

详细了解 openCV aruco 标记检测/姿态估计：亚像素精度的相关文章

Django 是否使用一个线程来处理 WSGI 或 Gunicorn 中的多个请求？

根据标题我想知道 Django 在通过 WSGI 或 Gunicorn 运行时是否使用一个线程来处理多个请求我知道从不应该访问的地方访问请求是一种不好的做法但我仍然想这样做我认为有充分的理由例如在我的自定义模板加载器中访问当前用户
如何将一组重叠范围划分为不重叠范围？

假设您有一组范围 0 100 一 0 75 b 95 150 c 120 130 d 显然这些范围在某些点上重叠您将如何剖析这些范围以生成不重叠范围的列表同时保留与其原始范围相关的信息在本例中为范围后面的字母例如运行算法后的上述
防止脚本目录被添加到Python 3中的sys.path

有没有办法阻止脚本的目录被添加到python3中的sys path 由于导入在 python 中是相对的因此我遇到了导入冲突我正在处理的一个遗留项目有一个名为logger py在与内置冲突的脚本的根目录中logger 我使用的自定义构建
AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
通过 SSH 的 Pygame 不注册击键（Raspberry Pi 3）

所以我得到了 raspi 3 和简单的 8x8 LED 矩阵在玩了一些之后我决定用 pygame 的事件制作一个简单的蛇游戏显示在该矩阵上我之前没有 pygame 的经验除了 LED 矩阵之外没有连接任何屏幕显示器所以最初的
Python：按条件绘制多个正/负条形图

这是我第一次用 python 绘制条形图我的 df 操作 key descript score 0 noodles taste 5 1 noodles color 2 2 noodles health 3 3 apple color 7
Scrapy 仅抓取每个页面的第一个结果

我目前正在尝试运行以下代码但它只保留每个页面的第一个结果知道可能是什么问题吗 from scrapy contrib spiders import CrawlSpider Rule from scrapy contrib linkext
使用 Python 读取 App Engine 上的文件？

是否可以在 GAE 上打开文件来读取其内容并获取最后修改的标签我收到 IOError Errno 13 文件无法访问我知道我无法删除或更新但我相信阅读应该是可能的有人遇到过类似的问题吗 os stat f r st mtim 您可能
尽管 Matplotlib FuncAnimation(...,repeat=False) 保存的动画图不断循环

我想使用制作动画matplotlib进行 Powerpoint 演示动画应该只播放一次在我的代码中参数repeat of FuncAnimation 被设置为 false 因为我需要将图导入到powerpoint中所以我使用保存它a
在 LINUX 上使用 Python 连接到 OLAP 多维数据集

我知道如何在 Windows 上使用 Python 连接到 MS OLAP 多维数据集嗯至少有一种方法通常我使用 win32py 包并调用 COM 对象进行连接 import win32com client connection wi
如何从分组数据创建直方图

我正在尝试根据 pandas 中的分组数据创建直方图到目前为止我已经能够创建标准线图但我不知道如何做同样的事情来获取直方图条形图我想获得泰坦尼克号事故中幸存者和未幸存者的 2 个年龄直方图看看年龄分布是否存在差异来源数据 ht
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
在 Python 中快速确定小于 10 亿的数字是否为素数

我目前在 python 中检查数字素数的算法对于 1000 万到 10 亿之间的数字来说速度很慢我希望它能够得到改进因为我知道我永远不会得到超过 10 亿的数字背景是我无法获得足够快的实现来解决项目 Euler 的问题 60 我在 7
用于 OAuth 身份验证的 WSGI 中间件

我使用构建了一个非常小的网络应用程序Flask http flask pocoo org 现在我想向网站添加非常基本的身份验证我不需要授权由于 Flask 不支持开箱即用的 auth auth 我想插入 WSGI 中间件来完成这项工作
在python中打开带有重音符号的文本文件

我尝试使用 Python 2 7 打开法语文本文件我使用了命令 f open textfr r 但是当我使用 f read 我失去了重音字符我明白了u J xc3 xa9tais xc3 xa0巴黎而不是J tais 巴黎等当在lin
如何检索 SQLAlchemy 结果集的 python 列表？ [复制]

这个问题在这里已经有答案了我有以下查询来检索单列数据 routes query select schema stop times c route number schema stop times c stop id stop id dis
使用 asyncio 时应该如何创建属性？

在创建使用 asyncio 的类时我发现自己处于属性 getter 需要进行 io 操作的情况因此该函数应该是一个协程然而等待房产的感觉却很不寻常这是我的意思的一个最小的例子该代码有效并且可以运行 import asyncio
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
Django：单击按钮加载另一个模板

我已经在 django 项目上工作了几个星期只是玩玩以便掌握它的窍门我有点困惑我现在有一个名为 home html 的模板我想知道是否可以将另一个名为 profile html 的模板设置为 home html 模板上的链接我有一
如何将 c_uint 的 ctypes 数组转换为 numpy 数组

我有以下 ctypes 数组 data ctypes c uint 100 我想创建一个 numpy 数组np data包含来自 ctypes 数组数据的整数值 ctypes 数组显然稍后会填充值我看到numpy中有一个ctypes接口

随机推荐

MIPS 浮点：swc1 与 s.s

我正在做一些涉及的工作MIPS汇编我不断遇到这四个浮点加载存储伪指令 l s l d s s s d 我在网上找到了一些文档发现有四个实际指令似乎可以做同样的事情 lwc1 ldc1 swc1 and sdc1 我唯一的问题是有
Java 和 Android 之间的 Base64 编码/解码错误

我在 Java 和 Android 之间编码解码 Base64 时遇到问题这是我的案例我在Java上使用ECC编写了加密解密代码我的代码运行得很好然后我尝试在Java上加密字符串并在Android上解密这个加密的字符串但失败了
1-15 的正则表达式？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我很难为 0 15 的数字输入组合正
我怎样才能快速转换这个日期格式？

我想转换Wed Jul 01 04 48 51 0000 2015 to 2015 07 01我在下面尝试过但它不能很好地执行返回零 let d Wed Jul 01 04 48 51 0000 2015 let formatter N
OnLocationChanged 回调永远不会被调用

我正在尝试使用以下命令获取用户当前位置LocationManager 我做了很多研究似乎找不到任何人有同样的问题这OnLocationChanged回调似乎从未被调用下面是我的各种代码和 logcat protected Locati
在 Windows Phone 上部署 Sencha 触摸应用程序

我有一个现有的 Sencha touch 项目我想将其部署在 Windows Phone 设备上到目前为止我已经尝试将 Sencha touch 与 Phonegap 结合起来通过 Phonegap 进行部署但没有成功据报道由
.:format 在 rake 路由中意味着什么

我输入 rake 路线然后得到一堆像这样的 url articles id format 我的问题是什么是 format意思是 Rails Guides Routing 文章中并不清楚并且没有其他有用的匹配项 format在 Stac
笛卡尔坐标到极坐标（3d 坐标）

如何在 3D 空间中的笛卡尔坐标系和极坐标系以及反坐标系之间进行转换最好有一个 C 示例但任何内容都将不胜感激谢谢 Edit当考虑20 的变化时不形成球体 Edit 2 private void Spherise for int
如何在 ASP.NET 中上传图像文件而不进行任何回发

我正在使用上传文件
无法在 getRequiredModulePath 的 NodeObject.getText 处读取未定义的属性“文本”

生成浏览器应用程序包时发生错误阶段设置什么可能导致此错误来自控制台的信息生成浏览器应用程序包阶段设置类型错误无法读取未定义的属性文本在 NodeObject getText opt app root src node
Vee-Validate validateAll() 范围

我有一个场景我已经划分出范围一个表单以便我可以使用以下函数一次验证小块 validateScope scope return this validator validateAll scope 我想在将整个表单提交到服务器之前对其进行
如何从Word 2010 Addin（用C#开发）获取“KeyPress”事件？

如何从用 C 开发的 Word 2010 Addin 捕获 KeyPress 事件注意我不是在寻找复杂的解决方案例如挂钩之类的东西而是在寻找漂亮整洁的解决方案 NET 甚至来自对象模型我手中的应用程序对象是 Microso
Angular 2在路由时传递对象

我试图在路由时在页面之间传递对象数组为此我做了什么这个答案 https stackoverflow com questions 35478994 angular 2 passing object via route params pos
如何为 lm() 设置平衡单向方差分析

我有数据 dat lt data frame NS c 8 56 8 47 6 39 9 26 7 98 6 84 9 2 7 5 EXSM c 7 39 8 64 8 54 5 37 9 21 7 8 8 2 8 Less 5 c 5 9
getRootPane() 默认按钮 - 这是一个错误吗？

我做了一个SSCE 请注意它必须是 Windows 外观和感觉 import java awt import javax swing public class DefaultButtonBug private static final S
tbl_df 被转换为 S4 类中的列表

当我尝试使用时tbl df在中四班 tbl df插槽似乎转变为list library tibble setOldClass c tbl df tbl data frame setClass Class TestClass slots c
转置和扩展数据

我的熊猫数据框如下所示 Country Code 1960 1961 1962 1963 1964 1965 1966 1967 1968 2015 ABW 2 615300 2 734390 2 678430 2 929920 2 963
FFmpeg 的 avcodec_decode_audio3 返回 -1

我在android上使用FFmpeg来解码mp3 我在配置中设置了所有解码器启用并正确制作了 so 文件这是为配置文件添加参数的 sh NDK android ndk r5b PLATFORM NDK platforms android
如何最小化 R 包的安装大小

在我的工作场所我们正在为不同版本的 R 安装许多库所需的大小正在迅速增加我可以做什么来尽可能减少每次安装我知道 no docs 并且我需要 with keep source EDIT 这是对我的设置的快速研究我将我的图书馆复制到
详细了解 openCV aruco 标记检测/姿态估计：亚像素精度

我目前正在研究openCV的 aruco 模块特别关注ArUco标记和AprilTags的poseEstimation 在研究子像素精度时我遇到了一种奇怪的行为如下代码所示如果我确实提供了完美校准例如 cx cy 等于图像中心

详细了解 openCV aruco 标记检测/姿态估计：亚像素精度

详细了解 openCV aruco 标记检测/姿态估计：亚像素精度 的相关文章

随机推荐

热门标签

详细了解 openCV aruco 标记检测/姿态估计：亚像素精度的相关文章