CVPR 2023|3D模型分割新方法!不用人工标注,只需一次训练,未标注类别也能识别

2023-10-31

不需要人工标注,只需要一次训练,就能让3D模型理解语言并识别未标注过的类别

比如看下面这个例子,未标注的(unannotated)黑板和显示器,3D模型经过这个方法训练之后,就能很快“抓准”目标进行划分。

再比如,给它分别输入sofa、cough这类同义词刁难一下,也是轻松拿下。

甚至连浴室(bathroom)这类抽象分类也能搞定。

这个新方法名叫PLA (Point-Language Assocation),是一种结合点云(目标表面特性的海量点集合)和⾃然语⾔的方法。

目前,该论文已经被CVPR 2023接收。

不过话说回来,不需要⼈⼯标注,只进行⼀次训练,同义词抽象分类也能识别……这可是重重buff叠加。

要知道一般方法使用的3D数据和⾃然语⾔并不能够直接从⽹上免费获取,往往需要昂贵的⼈⼯标注,而且一般方法也⽆法根据单词之间的语义联系识别新类别。

那PLA又是如何做到的呢?一起来看~

具体原理

其实说白了,要成功实现3D模型划分,最重要的一步就是让3D数据也能理解⾃然语⾔。

专业点来说,就是要给3D点云引⼊⾃然语⾔的描述

那怎么引入?

鉴于目前2D图像的划分已经有比较成功的方法,研究团队决定从2D图像入手。

首先,把3D点云转换为对应的2D图像,然后作为2D多模态⼤模型的输⼊,并从中提取对于图像的语⾔描述。

紧接着,利⽤图⽚和点云之间的投影关系,图⽚的语言描述也就自然能够关联到3D点云数据了。

并且,为了兼容不同粒度的3D物体,PLA还提出了多粒度的3D点云-⾃然语⾔关联方法。

对于整个3D场景⽽⾔,PLA将场景对应所有图⽚提取的语⾔描述进⾏总结,并⽤这个总结后的语⾔关联整个3D场景。

对于每个图像视⻆对应的部分3D场景⽽⾔,PLA直接利⽤图像作为桥梁来关联对应的3D点云和语⾔。

对于更加细粒度的3D物体⽽⾔,PLA通过⽐较不同图像对应点云之间的交集和并集,以及语⾔描述部分的交集和并集,提供了⼀种更加细粒度的3D-语⾔关联⽅式。

这样一来,研究团队就能够得到成对的3D点云-⾃然语⾔,这一把直接解决了人工标注的问题。

PLA用得到的“3D点云-⾃然语⾔”对和已有的数据集监督来让3D模型理解检测和分割问题定义。

具体来说,就是利⽤对⽐学习来拉近每对3D点云-⾃然语⾔在特征空间的距离,并推远不匹配的3D点云和⾃然语⾔描述。

讲了这么多原理,那PLA在具体分割任务中表现到底如何?

语义分割任务超越基准65%

研究⼈员通过测试3D开放世界模型在未标注类别的性能作为主要衡量标准。

先是在ScanNet和S3DIS的语义分割任务上,PLA超过以前的基线⽅法35%~65%。

在实例分割任务中,PLA也有提升,对比之前的方法,PLA提升幅度15%~50%不等。

研究团队

这个项目的研究团队来自香港大学的CVMI Lab和字节跳动。CVMI Lab是香港大学的一个人工智能实验室,实验室2020年2月1日成立。研究范围涵盖了计算机视觉与模式识别,机器学习/深度学习,图像/视频内容分析以及基于机器智能的工业大数据分析。

论⽂地址:
https://arxiv.org/pdf/2211.16312.pdf

项⽬主⻚:
https://github.com/CVMI-Lab/PLA

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

CVPR 2023|3D模型分割新方法!不用人工标注,只需一次训练,未标注类别也能识别 的相关文章

随机推荐

  • 以日期作为ts切片文件名问题的解决过程

    一 需求 EasyDarwin使用FFmpeg来保存流媒体 以多个ts分片形式存在 但由于EasyDarwin调用FFmpeg命令时 没有对生成名字做处理 所以默认生成的ts文件名都是out0 ts out1 ts 这种名称意义不大 需要以
  • 【华为OD机试真题 Java】最长连续子序列

    前言 本专栏将持续更新华为OD机试题目 并进行详细的分析与解答 包含完整的代码实现 希望可以帮助到正在努力的你 关于OD机试流程 面经 面试指导等 如有任何疑问 欢迎联系我 wechat steven moda email nansun09
  • 22款常用微信小程序UI框架推荐!

    22个好看 常用的微信小程序UI组件库推荐 1 WeUI 地址 https developers weixin qq com miniprogram dev extended weui 预览码 2 ColorUI 地址 https gith
  • flutter 数据持久化之sqflite

    sqflite 是一款轻量级的关系型数据库 类似SQLite 支持iOS和Android 适用于存储数据库 表类型的数据 使用 添加依赖 dependencies flutter sdk flutter sqflite插件 sqflite
  • html怎么在网页标题栏上添加图标

    需求 像下图这样给网页标题栏加个图标 方法 需要先把图片格式转换为 ico类型 在这个网址在线转换很方便 https www easyicon net covert 在加一行来显示图标 注意 如果加入了没有效果 检查一下路径是否正确 文件名
  • Linux安装rsync命令失败,rsync 常见错误与解决方法整理

    我们都是通过错误日志查看 在rsyncd log里面或 err文件里面 大家可以用记事本打开查看 注意windows下面我们需要给SvcwRsync用户 管理同步目录的所有权限 基本上这样就可以了 问题一 ERROR chroot fail
  • MySQL基本原理以及框架图

    数据库的定义 数据库简单来说是本身可视为电子化的文件柜 存储电子文件的所处 用户可以对文件 的数据运行新增 截取 更新 删除等操作 数据库指的是以一定的方式存储在一起 能为多个用户共享 具有尽可能小的冗余度 与应用程序彼此独立的数据集合 数
  • 反转链表:双指针法

    给你单链表的头节点 head 请你反转链表 并返回反转后的链表 指针 快慢指针 pre指向前一个节点 cur指向当前节点 temp用于保存当前节点的下一个节点 Definition for singly linked list public
  • Echarts柱状图设置柱间距不生效

    由于要做进度条样式的柱状图 如图所示 所以想做点柱子之间的间距 于是设置barGap代码配置如下 这里是错误示范 series name type bar data this downLoadChartsData seriesData ba
  • win10VirtualBox没有64位选项

    Windows10中Virtualbox没办法选择和安装64位的Linux系统 2017 03 08 十有三 0 浏览 5080 操作系统与应用 Windows系统 Linux 明明在公司的WIN7系统中使用Virtualbox就可以安装6
  • 一文详解shell 脚本语言的基本结构,万字长文,建议收藏

    2 1 shell脚本的用途 自动化常用命令 执行系统管理和故障排除 创建简单的应用程序 处理文本或文件 2 2 shell脚本基本结构 shell脚本编程 是基于过程式 解释执行的语言 编程语言的基本结构 各种系统命令的组合 数据存储 变
  • 单片机C语言之指针变量

    单片机C语言变量分别有char型 int型 long型 float型等 它们分别占用内存为1个单元 2单元 4单元 4单元等 另外数组和字符串则占用了内存某段连续的单元 这些变量的共同特征是它们都装的数值 那如果一个变量里面装的不是数值 而
  • 操作系统及驱动、进程、服务等解析

    操作系统是神马呢 顾名思义就是操作管理及控制计算机硬件与软件资源的计算机程序 同时也是计算机硬件和软件的接口 操作系统充当着用户和硬件设备之间桥梁的作用 用户可以通过操作系统让硬件设备工作实现自己想要的要求 但大部分是通过应用程序让操作系统
  • Java调用.exe文件

    package cn sos psasps public class TestExe public static void main String args Runtime runtime Runtime getRuntime test01
  • linux权限---【600,644,700,755,711,666,777】

    权限简介 Linux系统上对文件的权限有着严格的控制 用于如果相对某个文件执行某种操作 必须具有对应的权限方可执行成功 Linux下文件的权限类型一般包括读 写 执行 对应字母为 r w x Linux下权限的粒度有 拥有者 群组 其它组
  • 小故事理解TCP/IP连接时的三次握手

    在TCP IP协议中 TCP协议通过三次握手建立一个可靠的连接 示意图如下 下面通过一个小故事简单理解一下这三次握手的具体含义 一天 快递员小客 客户端 准备去小服 服务器 家去送快递 准备与服务器进行连接 当走到小服家门口发现 小服家大门
  • (附源码)springboot大学生防疫封校管理系统 毕业设计632124

    大学生防疫封校管理系统 摘 要 2019年12月19号中国武汉发生第一例新冠病毒的到来 大家都在听从政府的号召在居家隔离 不管是在城市还是在乡镇 农村 这引起我的注目 设计一套大学生防疫封校管理系统 疫情防控需要大家共同努力 团结对校园学生
  • Qt QCommandLinkButton学习

    widget h ifndef WIDGET H define WIDGET H include
  • Nginx的配置(转载)

    虚拟主机与域名解析 虚拟主机是使用特殊的软硬件技术 把一台运行在因特网上的服务器主机分成一台台 虚拟 的主机 每一台虚拟主机都具有独立的域名 具有完整的Internet服务器 WWW FTP Email等 功能 虚拟主机之间完全独立 并可由
  • CVPR 2023|3D模型分割新方法!不用人工标注,只需一次训练,未标注类别也能识别

    不需要人工标注 只需要一次训练 就能让3D模型理解语言并识别未标注过的类别 比如看下面这个例子 未标注的 unannotated 黑板和显示器 3D模型经过这个方法训练之后 就能很快 抓准 目标进行划分 再比如 给它分别输入sofa cou