【点云】Large-scale Point Cloud Semantic Segmentation with Superpoint Graphs

2023-11-01

目录

1 摘要

2 介绍

3 方法

3.1 基于全局能量的集合分割

3.2 建立超点图

3.3 嵌入超点

3.4上下文分割


1 摘要

我们提出一个基于深度学习的框架,来解决大规模点云的语义分割问题。我们认为点云的组织形式可以被SPG(Superpoint Graph)有效的捕获,SPG是从被分割为几何均匀部分的扫描场景中得到。SPGs提供了一个紧凑但是充足的目标上下文关系的表示,并可以被应用到图卷积网络。

 

2 介绍

大规模点云的语义分割有大量挑战,这些困难阻碍了卷积神经网络的应用:(1)大规模数据;(2)没有明确的组织结构(图片的规则网格)。前人希望将CNN结构在图片分割中的成功应用复制到点云数据上,比如:(1)SnapNet: 将点云转换为一系列二维RGBD快照,对快照的语义切割可以应用到原数据上。(2)SegCloud: 在规则体素网格中使用三维卷积。

然而,我们认为这些方法没有捕捉到点云数据的固有结构,因此限制了描述的表现。将点云转换为二维格式会带来信息的损失,并且要求做表面再卷积,这和语义分割一样难。点云的体积表示是低效的,并会丢失细节。还有很多特别为点云设计的深度学习模型,表现不错,但是受限于输入数据的尺寸。

我们提出了一种大规模点云的表示方式,简单形状(超级点)内在联系的集合,是用于图像语义分割的超级像素的迁移。这种结构可以被属性有向图(SPG)捕获,它的结点代表简单形状,边描述了结点被丰富的边特征描述的邻近关系。

SPG有很多优点:

(1)取代了去对单个点或体素的分类,SPG关注整个目标部分,这更容易被分类

(2)SPG可以细节地描述邻近物品的关系,这对上下文分类很重要:车总是在路上,天花板总是被墙所环绕。

(3)SPG的大小被简单结构的数量所决定而不是点云中点的数量,这少了好几个量级。

这使得我们可以将大规模内在关系模型化。我们的贡献如下:

(1)我们介绍了SPG,一种全新的点云表示方式,带有丰富的边特征,表征了点云部分间的上下文关系。

(2)基于这种表达,我们可以在大规模点云上应用深度学习,而不需要牺牲细节,我们的结构包括PointNets,用于超级点的嵌入和图卷积,以及上下文分割。并且我们介绍了一种全新的、更高效的以边为条件的卷积(ECC),和一种新得输入门格式GRU

 

3 方法

我们主要想解决点云的大小问题。点云往往包含上亿个点,使得很难直接使用深度学习方法。我们提出的SPG表示使得我们将语义分割问题划分为三个不同的问题。

(1)几何同质分割:将点云分割为简单但富有意义的几何形状。这个无监督步骤,将所有点云作为输入,因此必须被高效地计算。通过这个分割,SPG可以被简单地计算。

(2)Superpoint嵌入:SPG的每个点都关联于点云的一个小的部分,我们假设这部分是语义同质的。通过降采样,最多数百个点可以代表这些初始部分。减小输入点云的规模,使得我们可以使用PointNet。

(3)上下文分割:SPG比任何其他在初始点云上建立的图更小。基于图卷积的深度学习方法可以用大量的边特征(促进了特征大范围的互动)对点分类。

 

3.1 基于全局能量的集合分割

我们的目标不是分离出像车、椅子这样的实际个体,而是这些更简单、共有的抽象部分。我认为这一步类似于图像中设计卷积核提取特征,只不过这里使用的是无监督方法。注意,这一步是完全无监督的,并且没有使用分类的标签。

输入点云C,有n个点,每个点,被它的三维位置,或者,其他观察值,比如颜色、强度所定义。对每个点,我们计算个集合特征,描述了局部邻近的形状。我们使用:线性,平面性和散射linearity, planarity, scattering)。我们也计算了每个点的高度,定义为pi在整个输入点云归一化坐标中的

Global energy10最近邻邻接图Gnn = (C, Enn)。几何同质分割定义为以下优化问题解的常数连通分量

其中[·]是Iverson bracket(艾佛森括号,如果括号内的条件满足则为1,不满足则为0),边w的权值随边的长度线性递减。因子μ是正则化强度,它决定了结果划分的粗糙程度。

要使全局最小,(1)gi应该尽可能等于fi;(2)gi应该尽可能等于gj。具体来说,(1)希望gi尽可能的“代表”fi;(2)希望gi, gj尽可能相同。带来的结果就是,使得尽可能多的特征相似的点的g值相同。最后,g值相同的点被视作一个Superpoint。全部的点被划分为:

 

3.2 建立超点图

,其中S是超点,是超边代表超点间的邻接关系。超边由df个特征,描述了超点间的邻接关系。F是特征矩阵。

 

对称Vorinoi邻接图。如果在Evor中至少存在一条边,连接两个超点S和T,则S和T有邻接关系。

超边特征描述:

各超点间点的位置的协方差矩阵的特征按降序排序:

Length(S) = λ1

Surface(S) = λ1λ2

Volume(S) = λ1λ2λ3

 

3.3 嵌入超点

为了保证批处理的效率和数据扩充的方便,我们将实时采样的超级点降至np = 128点。因为PointNet的max-pooling操作,降采样并不会影响效果。但我们也观察到当超点的点数少于nminp = 40时,效果变差。

为了让PointNet学习不同形状的空间分布,在嵌入前,每个超点被重新标为单位球。点被正则化距离,观察值,oi和几何特征表示。为了为了保持形状大小的协变,超点的原始公制直径,在PointNet的max-pooling之后被连接使用,作为额外的特征。最后每个超点Si嵌入PointNet得到一个dz维的向量zi。

 

3.4上下文分割

我们的方法基于Gated Graph Neural Networks和Edge-Conditioned Convolutions。总的来说,超点根据超边的信息片段来改进它们的嵌入。

参考:https://blog.csdn.net/Dujing2019/article/details/104091750

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【点云】Large-scale Point Cloud Semantic Segmentation with Superpoint Graphs 的相关文章

  • 常用正则表达式

    正则表达式用于字符串处理 表单验证等场合 实用高效 现将一些常用的表达式收集于此 以备不时之需 匹配中文字符的正则表达式 u4e00 u9fa5 评注 匹配中文还真是个头疼的事 有了这个表达式就好办了 匹配双字节字符 包括汉字在内 x00
  • Python移动和嵌入式视觉应用卷积神经网络模型压缩策略

    概述 模型压缩是在计算资源有限且能耗紧张的移动设备上 有效部署神经网络模型的关键技术 传统的模型压缩技术依赖于手工制作的启发式和基于规则的策略 这需要领域专家探索在模型大小 速度和准确性之间进行权衡的大型设计空间 这通常是次优且耗时的 在本
  • dos 添加防火墙入站规则

    dos 添加防火墙入站规则 使用DOS命令如何操作Windows防火墙 命令介绍及应用举例 一 命令格式 netsh firewall 参数 命令功能 显示命令列表 add 添加防火墙配置 delete 删除防火墙配置 dump 显示一个配
  • NoClassDefFoundError之BeanCreationException异常

    前言 根据部门技术要求 同时提高系统的稳定性和易维护性 需要对现有系统进行技术升级改造 在技术改造的过程中难免会遇到一些问题 令我印象比较深刻的就是文章标题所说的BeanCreationException异常 这个看似比较常见的异常出现的原
  • function/bind的救赎(上)

    本文转自孟岩的博客 http blog csdn net myan article details 5928531 这是那篇C 0X的正文 太长 先写上半部分发了 Function bind可以是一个很简单的话题 因为它其实不过就是一个泛型
  • linux查看进程 显示,Linux如何查看和控制进程

    Linux如何查看和控制进程 前言 程序是保存在外部存储介质 如硬盘 中的可执行机器代码和数据的静态集合 而进程是在CPU及内存中处于动态执行状态的计算机程序 在Linux系统中 每个程序启动后可以创建一个或多个进程 例如 提供Web服务的
  • 等高线种类及特点

    地形图上的等高城分为首曲线 计曲线 间曲线和助曲线四种 见下图 首曲线 又叫基本等高线 是按规定的等高距 由平均海水面起算而测绘的细实线 线粗0 1毫米 用以显示地貌的基本形态 计曲线 又叫加粗等高线 规定从高程起算面 平均海水面 起算的首
  • 一个月,英语能提高多少?附资料分享

    学习语言是一个漫长的过程 但对于我这样一个英语小白 利用业余时间 一个月的学习 还是能看到不少的进步 除了听 说 读 写等能力方面有提升之外 最大的收获就是培养了英语学习和运用的兴趣 这样的结果对我来说 还是很满意的 自然也多了继续探索英语
  • STM32CubeMX代码生成和点亮LED

    所需工具STM32CubeMX和Keil5 1 先打开STM32CubeMX软件 点击New Project新建工程 2 在搜索框中搜索你的项目芯片 3 搜索出来有两个不同封装的芯片 写程序没区别 但是这个软件可以生成IO说明文档 可能会导
  • 【恒指早盘分析】10.8恒指今日复盘及后市思路

    10月8日消息 美股周一震荡收跌 市场正关注国际贸易局势的进展 美联储官员讲话以及经济数据 今日开盘 港股恒指高开0 11 随后一度涨逾1 重返26000点 截至午间收盘 恒生指数踏浪点神 1376338 669 73 46 0 28 涨0
  • justify-content、align-content、align-items、align-self的区别

    提示 CSS flex direction属性指定了内部元素是如何在 flex 容器中布局的 定义了主轴的方向 正方向或反方向 默认主轴为正方向 侧轴 与主轴垂直的轴叫侧轴 justify 使齐行 align 排列 使成一条直线 wrap
  • VBJSON报错:缺少:语句结束

    项目中使用JSON库VBJSON时报错 编译错误 缺少 语句结束 cJSONScript和cStringBuilder报相同的错误 都在第一行 VERSION 1 0 CLASS 研究了半天没啥结果 之前使用这个库的时候没有什么问题 所以判
  • Spring boot踩坑日记——ERROR c.n.d.s.t.d.RedirectingEurekaHttpClient - Request execution error

    eureka启动报错 2018 12 21 17 20 16 480 main ERROR c n d s t d RedirectingEurekaHttpClient Request execution error com sun je
  • https://github.com/qiangqiang666/demo

  • Apache Log4j2远程代码执行漏洞复现(CVE-2021-44228)-----记第一次反弹shell

    目录 靶场搭建 漏洞测试 漏洞利用 总结 靶场搭建 因为没有服务器所以只能在本地搭建 在虚拟机上拉取文件 git clone https github com vulhub vulhub git Vulhub Docker Compose
  • MariaDB安装教程

    注 从MariaDB 10 4 3开始 不再提供预构建的数据目录 并且用户需要运行mysql install db exe来创建数据目录 1 解压到自定义路径 E MariaDB mariadb 10 5 4 winx64 2 将其中的bi
  • java 类之间相互引用实例探索

    本文记录一下自己对类之间相互引用的探索 如有错误 希望不吝赐教 问题一 类之间相互引用依赖会不会引用死循环 不会 例如 A类中声明一个B类的引用 B类中也声明一个A类的引用 因为类之间的引用相当于指针 声明的时候不会分配对象 即使你在A构造
  • Windows下使用Redis(一)安装使用

    一 Redis 是什么 Redis 是一款依据BSD开源协议发行的高性能Key Value存储系统 cache and store 它通常被称为数据结构服务器 因为值 value 可以是 字符串 String 哈希 Map 列表 list

随机推荐

  • Error creating bean with name 'sessionFactory' defined in class path resource [...]

    已解决 spring hibernate 报错原因 applicationContext xml中没有引入实体映射文件 实体映射文件
  • 文盘 Rust -- tonic-Rust grpc 初体验

    gRPC 是开发中常用的开源高性能远程过程调用 RPC 框架 tonic 是基于 HTTP 2 的 gRPC 实现 专注于高性能 互操作性和灵活性 该库的创建是为了对 async await 提供一流的支持 并充当用 Rust 编写的生产系
  • Ceph运维存储 命令管理操作

    分布式存储运维操作 集群服务管理常用命令 统一节点上的ceph conf文件 将admin节点上修改的ceph conf 推送给所有其他节点 overwrite conf强制覆盖 ceph deploy overwrite conf con
  • C++常用头文件小结

    标准 C include
  • spring cloud 大大大大的坑。 Failed to start bean 'eurekaAutoServiceRegistration'

    先说明一下问题 我在做cloud 消费服务的时候 不是我做的我负责改而已 因我们boot 用的是1 5 4的发行版本 然后 cloud和boot的版本不一样又引入了解决的包 最后被我改回来 导致不能启动 在spring boot 中直接启动
  • 自动创建字符设备驱动的设备文件

    目录 问题描述 解决方案 udev 嵌入式中用的是mdev 相关函数 在调用device create前要先用class create创建一个类 Linux内核中有各种类 比如gpio rtc led等 类这个概念在Linux中被抽象成一种
  • SpringBoot默认包扫描机制及使用@ComponentScan指定扫描路径

    SpringBoot默认包扫描机制 标注了 Component和 Component的衍生注解如 Controller Service Repository就可以把当前的Bean加入到IOC容器中 那么SpringBoot是如何知道要去扫描
  • Java基础进阶--注解

    Java基础进阶 注解 什么是注解 元注解 Target Retention 注解的应用场景 APT IDE输入限定检查 字节码编码 注解与反射 什么是注解 注解就是一个标签 可以放在任何地方 一个类 一个方法 一个变量 都可以用注解来标注
  • 基于testNG的通用数据驱动-DataProvider

    上一篇有提过可以通过DataProvider做数据驱动 通过 Test dataProvider abc DataProvider name abc 来获取指定的测试数据 在缺点是测试数据需要保存在代码中 如果想从外部获取参数 需要一个通用
  • 预测性维护(2)

    预测性维护 应用开发 预测性维护 应用开发流程 数据获取 数据处理 特征提取 模型训练 模型部署 预测性维护 应用开发流程 预测性维护应用从开发流程而言 和标准的机器学习类应用有其相似性 通常而言包括如下的五步法 数据获取 数据处理 特征提
  • 分布式一致性协议——CAP Paxos Raft ZAB

    一致性算法 Paxos Raft ZAB 1 1 CAP理论 分布式系统的CAP理论 理论首先把分布式系统中的三个特性进行了如下归纳 一致性 C 在分布式系统中的所有数据备份 在同一时刻是否同样的值 等同于所有节点访问同一份最新的数据副本
  • hibernate框架入门

    1 在IDE中创建java项目 比较简单不再演示 2 创建source folder 命名为Hibernate3 在Hibernate下载文件中找到我们所需要的三个配置文件和所有jar包 拷贝所需jar文件 构建依赖包 3 提供hibern
  • 2207. 字符串中最多数目的子字符串

    leetcode力扣刷题打卡 题目 2207 字符串中最多数目的子字符串 描述 给你一个下标从 0 开始的字符串 text 和另一个下标从 0 开始且长度为 2 的字符串 pattern 两者都只包含小写英文字母 你可以在 text 中任意
  • 使用Java流进行输入和输出操作

    使用Java流进行输入和输出操作 Java流是一种用于在程序中进行输入和输出操作的重要工具 流可以将数据从一个地方传输到另一个地方 例如从文件读取数据或将数据写入文件 在Java中 流被广泛用于处理输入和输出 以及进行网络通信 文件操作等
  • Python副业兼职,月赚7800元,一天只要两小时 !

    现在学习python的人越来越多了 跟大家聊聊如何利用python搞副业赚钱 想要利用 Python 赚钱的方式还是比较多的 其中接单和投稿算是两种比较简单的方式了 如果你是业余学python爬虫 可以去淘宝上加了找了几个店铺直接问需要爬虫
  • 编译报错:TypeError: Cannot read property ‘styles‘ of undefined at Object.loader

    编译报错 TypeError Cannot read property styles of undefined at Object loader 如下图 因为我的vue loader的版本是17以上 太高了 需要降到15的版本 我重新下的版
  • vue 异步加载远程组件(支持编译less语法)

    本代码已组件化 可以直接使用 说明 本组件可以直接解析 vue文件 为了支持less语法解析 在组件中引入less js 可在less官网下载 组件代码
  • 戴尔r510服务器不显示,戴尔 服务器dell R510 与 dell R710 对比

    戴尔台式机DELL服务器R510与R710的区别 戴尔台式机DELL服务器R510和R710有好多相同之处 1 都是2U服务器 2 都是双CPU服务器 3 所用CPU都是INTEL5500系列CPU 4 所用内存也是同样型号 R410 R5
  • PTA(Basic Level) 1094 谷歌的招聘

    2004 年 7 月 谷歌在硅谷的 101 号公路边竖立了一块巨大的广告牌 如下图 用于招聘 内容超级简单 就是一个以 com 结尾的网址 而前面的网址是一个 10 位素数 这个素数是自然常数 e 中最早出现的 10 位连续数字 能找出这个
  • 【点云】Large-scale Point Cloud Semantic Segmentation with Superpoint Graphs

    目录 1 摘要 2 介绍 3 方法 3 1 基于全局能量的集合分割 3 2 建立超点图 3 3 嵌入超点 3 4上下文分割 1 摘要 我们提出一个基于深度学习的框架 来解决大规模点云的语义分割问题 我们认为点云的组织形式可以被SPG Sup