英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

2023-11-09

普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。

水杯来回动的动态场景下,细节清晰可见:

静态场景效果也同样nice,狗狗突出的肋骨都被还原了出来:

对比来看其他方法,效果是酱婶的……

这就是英伟达最新提出的方法BundleSDF

这是一种可对未知物体的6D姿态追踪和三维重建的方法。

用于从单目RGBD视频序列中跟踪未知物体的6自由度运动,同时进行物体的隐式神经三维重建,方法接近于实时(10Hz)。

这种方法适用于任意刚性物体,即使视觉纹理大部分确实,仅需在第一帧中分割出物体,不需要任何额外的信息,并且不对智能体与物体的交互模式做任何假设。

目前,该方法已被CVPR 2023接收。

(论文具体内容可看下方视频介绍)

,时长05:25

可处理大幅度姿态变化、有遮挡视频

该方法的关键是一个神经物体场,它与姿态图优化过程同时进行,以便将信息稳健地累积到一致的3D表示中,捕捉几何和外观。

方法自动维护了一组动态的姿态内存帧,以便这些线程之间进行通信。

它能处理具有大幅度姿态变化、部分和完全遮挡、无纹理表面和高光反射等具有挑战性的视频。

作者展示了HO3D、YCBInEOAT和BEHAVE数据集上的结果,证明了我们的方法显著优于现有方法。

野外测试

用于iPhone 12 Pro Max的效果:

用于Intel RealSense的效果:

该方法不仅适用于更具挑战性的动态场景,还适用于此前经常被考虑的静态场景(移动相机)。

因此实现了比专门设计用于静态场景的那些方法更好或相当的结果(即文章开头展示动图)。

与SOTA对比

HO3D数据集上三种最具竞争力方法的定性比较。

左图:6自由度姿态跟踪可视化,其中轮廓(青色)以估计的姿态渲染。

值得注意的是,如第二列所示,我们的预测姿态有时甚至会纠正GT的错误。

右图:每种方法输出的最终3D重建的正面和背面视图。

由于手部遮挡,视频中的某些部分永远不可见。虽然从相同的视角渲染网格,但是DROID-SLAM和BundleTrack的显著漂移导致网格错误旋转。

定量结果对比如下:

问题设置

给定一段单目RGBD输入视频以及仅在第一帧中目标物体的分割掩码,该方法能持续追踪物体的6-DoF姿态并重建物体的3D模型。

所有处理都是在线自回归的(没有假设未来帧可用)。

处理的物体是刚性的,但不依赖其特定丰富的纹理 - 方法适用于无纹理的物体。

此外,不需要物体的实例级CAD模型,也不需要物体类别的先验知识(例如事先对同一物体类别进行预训练)。

具体框架

首先,在连续的分割图像之间匹配特征,以获得粗略的姿态估计(第3.1节)。

其中一些带姿态的帧被存储在内存池中,以便稍后使用和精化(第3.2节)。

从内存池的子集动态创建位姿图(第3.3节);在线优化与当前姿态一起联合细化图中的所有姿态。

然后,这些更新的姿态被存储回内存池中。

最后,内存池中的所有带姿态的帧用于学习神经物体场(在单独的线程中),该场建模了物体的几何和视觉纹理(第3.4节),同时调整其先前估计的姿态,使姿态跟踪更加鲁棒。

项目地址:
https://bundlesdf.github.io/

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建 的相关文章

  • 火焰检测 数据集

    开源项目1 https github com gengyanlei fire smoke detect yolov4 tree master yolov5 有数据集 Pytorch YOLOV4 火焰目标检测 石头儿啊的博客 CSDN博客
  • glut实现雪花动态效果

    glut实现雪花动态效果 实验题目 总体思路 3 2主要函数说明 按键操作 实验结果 实验题目 1 绘制雪花 2 在屏幕的多个随机位置绘制雪花 3 使每朵雪花绕自己的中心旋转 4 使每朵雪花下降 5 翻页键控制相机视野 按UP键增加物体与观
  • YOLOv5发布第六个版本,支持一键适配OpenVINO/OpenCV DNN部署

    YOLOv5发布了第六个版本 其它我不说 什么是开源精神 不是写个程序扔github就叫开源 而是持续不断改进 精益求精 不断演化版本 增加最有商业价值的功能 YOLOv5做到了 看看最新版本都有哪些新功能让开发者心动 新特性 首次发布支持
  • 小目标检测 改进 拆分拼接

    小目标Trick 论文链接 https paperswithcode com paper slicing aided hyper inference and fine tuning 代码链接 https github com obss sa
  • uniapp打包app,调用相机功能时在真机调试可以,打包成app之后不行

    在打包成app之后报如图所示错误 解决 在app模块配置勾选上相机这一项 如图 这是主要针对上面这个报错的 当然还有一下情况比较类似 就是相机功能在真机调试下可以 打包之后就不行了 我总结了如下几点 1 代码中的sourceType要配置为
  • Agisoft Metashape 坐标系选择 坐标转换

    Metashape 坐标系选择 坐标转换 文章目录 Metashape 坐标系选择 坐标转换 前言 一 软件设置 二 坐标系选择 1 有带号坐标系选择 2 无带号坐标系选择 二 坐标转换 以WGS84转CGCS2000投影坐标系为例 1 保
  • yoloe 超过yolox和yolov5

    号称超过yolox和yolov5的PP YoLoE 开源地址 GitHub PaddlePaddle PaddleDetection Object Detection toolkit based on PaddlePaddle It sup
  • 使用three.js渲染第一个场景和物体

    一 效果图 二 渲染场景和物体的步骤 创建场景 Scene 在 three js 中创建场景通过调用 THREE Scene 方法 然后将其赋值给变量 var scene new THREE Scene 创建相机 Camera 在 thre
  • 基于视觉重定位的室内AR导航APP的大创项目思路(3)手机相机内参数据获取和相机标定

    文章目录 相机内参 为什么要获取相机的内参数据 获取相机内存数据的方法 棋盘格标定 自动相机标定 前情提要 是第一次做项目的小白 文章内的资料介绍如有错误 请多包含 相机内参 相机内参是本身的物理数据 包括焦距f和缩放c 一般以矩阵K的形式
  • python-opencv对极几何 StereoRectify

    OpenCV如何正确使用stereoRectify函数 函数介绍 用于双目相机的立体校正环节中 这里只谈谈这个函数怎么使用 参数具体指哪些 函数参数 随便去网上一搜或者看官方手册就能得到参数信息 但是 相对关系非常容易出错 这里详细解释一下
  • 最强Transformer发布!谷歌大脑提出ViT-G:缩放视觉Transformer,高达90.45%准确率!

    Scaling Vision Transformers 论文 https arxiv org abs 2106 04560 1简介 视觉Transformer ViT 等基于注意力的神经网络最近在许多计算机视觉基准测试中取得了最先进的结果
  • 3dmax KeyError: ‘ Alphabet_S‘

    python opengl加载3d模型 报错 原因 mtl文件的name改了 更新一下就可以了 KeyError Alphabet S
  • vovnet 测试

    vovnet39 1070 640 640 batch 1 15ms 自己改了参数 import time import torch import torch nn as nn import torch nn functional as F
  • 图像分割2021

    cvpr2022总结 CVPR 2022 图像分割论文大盘点 大林兄的博客 CSDN博客 图像分割最新论文 尽管近年来实例分割取得了长足的进步 但如何设计具有实时性的高精度算法仍然是一个挑战 本文提出了一种实时实例分割框架OrienMask
  • 人脸分割 人脸解析 源码推荐

    2021年 有预训练 resnet50 126m 测试代码 python face warping test py i 0 e rtnet50 decoder fcn n 11 d cuda 0 Command line arguments
  • BMVC 2022 (东京大学)仅需90K参数!实时完成低光增强, 曝光矫正的超轻量级Transformer网络IAT,已开源

    本文由 52CV 粉丝投稿 作者 信息门下奶狗 知乎地址 https zhuanlan zhihu com p 535695807 我们提出Illumination Adaptive Transformer IAT 网络 用来探索实时的暗光
  • BASLER A404K 德国工业相机

    BASLER A404K是一款德国BASLER公司生产的工业相机 通常用于各种工业视觉和图像处理应用 以下是关于BASLER A404K工业相机的详细信息 型号和规格 A404K是该工业相机的型号 通常有特定的规格和配置 如分辨率 帧速率
  • Coco-LIC:紧耦合激光雷达-惯性相机里程计SOTA方案

    点击下方 卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 gt gt 点击进入 自动驾驶之心 SLAM 技术交流群 论文作者 Xiaolei Lang 编辑 自动驾驶之心 笔者个人理解 机器人在弱结构化 弱纹理环境中的状态估计
  • 最强姿态模型 mmpose 使用实例

    mmpose 介绍 https blog csdn net jacke121 article details 135040186 图片姿态实例 本机地址 B project pose mmpose dev 1 x Copyright c O
  • 眼神矫正AI一键修改你的眼睛眼球,直视相机!

    1 系统要求 软件运行支持32位 64位window 10 11系统 硬性要求 英伟达 RTX20系列或者更高级别 其他要求无 2 下载安装 链接 百度网盘 请输入提取码 提取码 1234 复制这段内容后打开百度网盘手机App 操作更方便哦

随机推荐

  • 亲密关系沟通-【信任感】-巩固信任感的沟通方法

    案例 老公答应做家务 同意了 但是总觉得他会忘 提醒他 结果嫌我啰嗦 我们还大吵一架 我真的是一个不会信任对方的人吗 要有信任感 你需要在沟通中成为两个人 1 能让别人信任你的人 2 有能力信任别人的人 其实你不信任ta 不是ta的原因 而
  • APP兼容性测试需要注意哪几点?-alltesting云测试

    由于终端设备的型号多样 机型的碎片化 使得APP兼容性问题在APP测试中成为一个不得不考虑的问题 因为一旦APP有兼容性方面的问题 就会影响这一类的很多用户 对业务的影响会比较大 针对这个问题的测试需要考虑覆盖多种不同的场景 严格来说 兼容
  • 【HDLbits刷题笔记 】04-verilog语法-程序部分

    Always块 组合 由于数字电路由用导线连接的逻辑门组成 因此任何电路都可以表示为模块和分配语句的某种组合 但是 有时这不是描述电路的最方便方法 过程 始终以块为例 提供了描述电路的替代语法 对于合成硬件 synthesizing har
  • Android adb等 获取root权限

    Android adb 获取root权限 1 自己编译的Android 中 adb shell后 自动获取root权限 即显示 而不是 方法 修改 default prop 把ro secure设为0 persist service adb
  • 位段的跨平台问题

    笔者在之前的两篇文章中已经详细的详解了 位段的各种问题 有意者请参考一下 位段的基础知识 大家都不怎么知道位段 参考链接为 位段的基础知识 大家都不怎么知道位段 念君思宁的博客 CSDN博客 对于位段的概念 想必大多数的C语言学者 都是不知
  • 接口接收数据_RGMII接口布线经验

    网络设备一定离不开MAC和PHY 有MAC和PHY的地方就有相应的接口 无论看得见或者看不见 它就在那里 不悲不喜 在以太网中 这个接口就是介质无关接口 英文称为Media Independent Interface 简称MII MII适用
  • 部署rancher

    rancher部署kubernetes 节点提前安装好docker环境 部署rancher 根据官网选择合适的rancher版本 并配置数据持久化启动rancher docker run d name rancher restart unl
  • QObject成员函数connect()函数

    1 首先要链接的两个类必须继承于QObject 同时添加 Q OBJECT 2 在qt中QObject connect中填写的signal和slot函数 一定要填写参数类型 因为类中的函数可以 也就是 重载函数名一样 参数不一样 如果QOb
  • C语言基础入门48篇_20_函数入门:为什么使用函数?(函数使得程序模块化 使用函数封装细节,使得程序员只要面向函数的接口编程(参数与返回值),而不用关心函数内部细节)

    菜鸟和高手都会基本 那菜鸟为什么是菜鸟 高手为什么是高手呢 很大的区别在于 高手写的程序 结构性 更好 更容易维护 而函数就是C语言结构化的一种手段 函数可以将大的计算任务划分为多个较小的任务 解耦合 一个设计得当的函数可以将不必要的细节给
  • 【C++]】蓝桥杯练习题 (入门训练 Fibonacci数列)

    img src data image png base64 iVBORw0KGgoAAAANSUhEUgAAA60AAAG8CAYAAAA1sEPIAAAgAElEQVR4Aey9TYudVdb v2x8Awa56QYRRTAgOPBHpS
  • 把eclipse的web项目导入到idea中

    一 导入项目 1 导入 2 module选择eclipse 没有该步骤可以跳过 3 之后一路next即可 二 配置依赖 1 配置依赖和jar包 1 Project 选择相应的sdk 2 Modules 选择导入的模块dataweb 选择De
  • SpringBoot快速实践 --Ⅰ

    文章目录 启动一个SpringBoot项目 如何替换内嵌容器 玩转SpringBoot配置 全局异常处理 过滤器 拦截器 使用Lombok简洁代码 使用IDEA HTTP Client进行接口调试 启动一个SpringBoot项目 如果你觉
  • house of storm

    一 漏洞利用条件 house of storm是一种结合了unsorted bin attack和large bin attack的攻击技术 其基本原理和large bin attack类似 漏洞发生在unsorted bin的chunk放
  • 【C++碎碎念】C++11新特性(声明、智能指针、右值引用、lambda表达式)

    目录 一 新类型 二 统一的初始化 三 声明 四 智能指针 五 右值引用 六 Lambda表达式 一 新类型 C 11新增了long long和unsigned long long 以支持64位 或更宽 的整型 新增了类型char16 t
  • 数据结构 顺序表的定义

    文章目录 1 2 1 顺序表的定义 1 2 2 顺序表上基本操作的实现 1 顺序表的建立 2 顺序表元素的插入 3 顺序表元素的删除 4 顺序表的查找 1 2 1 顺序表的定义 定义 顺序表是用一组地址连续的存储单元依次存储线性表中的数据元
  • flutter滚动到底部_flutter ScrollController如何滚动到底部?

    flutter ScrollController滚动到底部的示例代码如下 方式一 import package flutter scheduler dart import package flutter material dart void
  • 微信小程序开发全流程记录(从前台到后台,到发布)

    微信小程序开发流程记录 一 代码处理 一 微信小程序 前端显示 微信小程序项目的架构 部分特点说明 二 后台服务器 数据交互 需要的环境 特别注意 二 项目部署 一 Wampserver的设置 二 域名的获取 三 小程序官方网站上的设置 一
  • 阿里大数据之路:数据模型篇大总结

    第1章 大数据领域建模综 1 1 为什么需要数据建模 有结构地分类组织和存储是我们面临的一个挑战 数据模型强调从业务 数据存取和使用角度合理存储数据 数据模型方法 以便在性能 成本 效率之间取得最佳平衡 成本 良好的数据模型能极大地减少不必
  • Linux添加yum源,yum下载速度过慢

    CentOS系统更换yum软件安装源 此处以网易为例 第一步 备份你的原镜像文件 以免出错后可以恢复 mv etc yum repos d CentOS Base repo etc yum repos d CentOS Base repo
  • 英伟达新方法入选CVPR 2023:对未知物体的6D姿态追踪和三维重建

    普通手机 随手 拍的雕像 一下就变成了精细的三维重建图 水杯来回动的动态场景下 细节清晰可见 静态场景效果也同样nice 狗狗突出的肋骨都被还原了出来 对比来看其他方法 效果是酱婶的 这就是英伟达最新提出的方法BundleSDF 这是一种可