假设我有一组 5 个标记。我正在尝试使用增强现实框架找到每个标记之间的相对距离,例如AR工具包 http://www.hitl.washington.edu/artoolkit/。在我的相机中,前 20 帧仅向我显示前 2 个标记,以便我可以计算出 2 个标记之间的转换。第二个 20 帧仅显示第二个和第三个标记,依此类推。最后 20 帧显示了第 5 个和第 1 个标记。我想构建所有 5 个标记的标记位置的 3D 地图。
我的问题是,知道由于视频源质量低而导致距离不准确,根据我收集的所有信息,如何最大限度地减少不准确度?
我天真的方法是使用第一个标记作为基点,从前 20 帧中取变换的平均值,并放置第二个标记,依此类推,为第三个和第四个标记。对于第 5 个标记,通过将其放置在第 5 个和第 1 个以及第 4 个和第 5 个之间的变换平均值的中间,将其放置在第 4 个和第 1 个标记之间。我觉得这种方法对第一个标记的放置有偏见,并且没有考虑到相机每帧看到超过 2 个标记。
最终我希望我的系统能够计算出 x 个标记的地图。在任何给定帧中最多可以出现 x 个标记,并且由于图像质量而存在非系统错误。
任何有关解决此问题的正确方法的帮助将不胜感激。
编辑:
有关该问题的更多信息:
假设真实的世界地图如下:
假设对于图像中箭头表示的点之间的每个变换,我获得 100 个读数。实际值写在箭头上方。
我获得的值有一些误差(假设遵循关于实际值的高斯分布)。例如,标记 1 至 2 获得的读数之一可能是 x:9.8 y:0.09。鉴于我拥有所有这些读数,我如何估计地图。理想情况下,结果应尽可能接近真实值。
我的幼稚方法存在以下问题。如果从 1 到 2 的变换平均值稍微偏离,则即使 2 到 3 的读数非常准确,3 的位置也可能会偏离。这个问题如下图所示:
绿色是实际值,黑色是计算值。 1 到 2 的平均变换是 x:10 y:2。
您可以使用最小二乘法 http://mathworld.wolfram.com/LeastSquaresFitting.html方法,找到最适合所有数据的转换。如果您想要的只是标记之间的距离,那么这只是测量距离的平均值。
假设您的标记位置是固定的(例如,固定到固定的刚体),并且您想要它们的相对位置,那么您可以简单地记录它们的位置并对其进行平均。如果有可能将一个标记与另一个标记混淆,您可以逐帧跟踪它们,并使用每个标记位置在其两个周期之间的连续性来确认其身份。
如果您预计刚体会移动(或者身体不是刚体,等等),那么您的问题就会困难得多。一次两个标记不足以固定刚体的位置(需要三个)。但请注意,在每次转换时,您几乎同时获得旧标记、新标记和连续标记的位置。如果您已经有了每个标记在身体上的预期位置,那么这应该可以每 20 帧提供一个刚性姿势的良好估计。
一般来说,如果您的身体在移动,则最佳性能将需要某种动态模型,该模型应该用于跟踪其随时间变化的姿势。给定一个动态模型,您可以使用卡尔曼滤波器 http://en.wikipedia.org/wiki/Kalman_filter进行跟踪;卡尔曼滤波器非常适合集成您所描述的数据类型。
通过将标记的位置作为卡尔曼状态向量的一部分,您也许能够从纯粹的传感器数据中推断出它们的相对位置(这似乎是您的目标),而不是先验地要求此信息。如果您希望能够有效地处理任意数量的标记,您可能需要对常用方法进行一些巧妙的修改;您的问题似乎旨在避免通过传统的分解方法(例如顺序卡尔曼滤波)来解决。
编辑,根据以下评论:
如果您的标记产生完整的 3D 姿势(而不仅仅是 3D 位置),则附加数据将使您更轻松地维护有关您正在跟踪的对象的准确信息。然而,上述建议仍然适用:
- 如果标记的身体是固定的,则使用所有相关帧数据的最小二乘拟合。
- 如果标记的物体正在移动,则对其动力学进行建模并使用卡尔曼滤波器。
我想到的新点:
- 尝试管理一系列相对转变可能不是解决问题的最佳方法;正如您所注意到的,它很容易出现累积错误。然而,只要您可以在该框架中实现必要的数学,这也不一定是坏方法。
- 特别是,最小二乘拟合应该与相对姿势链或环完美配合。
- 无论如何,无论是最小二乘拟合还是卡尔曼滤波器跟踪,对测量不确定性的良好估计都将提高性能。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)