翻译:Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation

2023-11-02


文章地址: Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation

摘要

        稀疏注释语义分割(SASS)的目的是训练一个具有粗粒度(即点、涂鸦和块)监督的分割网络,每幅图像中只有一小部分像素被标记
        在本文中,我们提出了一种新的树能量损失的SASS,通过为未标记像素提供语义指导。树的能量损失表示图像为最小生成树,以模拟低水平和高水平的成对亲和性。通过将这些亲和性依次应用于网络预测,以一种从粗到细的方式生成未标记像素的软伪标签,实现了动态的在线自训练。将树的能量损失与传统的分割损失相结合,既有效且容易整合到现有的框架中。与以前的SASS方法相比,我们的方法不需要多阶段的训练策略、交替的优化程序、额外的监督数据或耗时的后处理,同时在所有的SASS设置中都优于它们。

介绍

        SASS分为三个级别:点        涂鸦        块

                                原图         全标签                 点                     涂鸦         块(介于全标签和涂鸦之间)
        在SASS中,每个图像可以分为标记区域和未标记区域。标记区域可以直接由ground truth监督。对于同一对象的区域,标记像素和未标记像素在低级颜色(图像的RGB值)高级响应(CNN产生的特征)上具有相似的模式。利用这对相似性,为未标记区域生成软伪标签,并实现在线自训练
        具体来说,引入了一种基于图像的低级和高级相似性的新型树形能量损失(TEL)。在TEL中,两个最小生成树(MSTs)分别构建在低级颜色和高级语义特征上。每个MST都是通过依次消除差异较大的相邻像素之间的连接来获得的,从而分离出较少的相关像素,并保持像素之间的基本关系。然后,将沿MST累积边权值得到的两个结构感知亲和矩阵以级联的方式与网络预测相乘,生成软伪标签。最后,将生成的伪标签分配给未标记的区域。将TEL与标准的分割损失(例如,交叉熵损失)相结合,任何分割网络都可以通过动态在线自我训练从未标记区域学习额外的知识。
        TEL容易插入到大多数现有的分割网络中

树过滤器:
       成对关系建模对许多计算机视觉任务具有重要意义。将图像视为无向平面图,其中节点均为像素相邻节点之间的边通过外观不相似性进行加权,可以根据大量权值去除边来构造最小生成树(MST)。由于相邻像素之间的梯度可以看作是对象边界的强度,因此节点倾向于在树上的同一对象内优先地相互交互。由于MST的结构保持特性,传统的树形滤波器被应用于立体匹配[40,41]、显著目标检测[33]、图像平滑[1]、去噪[27]和抽象[14]中。最近,LTF[26]提出了一种可学习的树过滤器来捕获语义分割的长期依赖性。LTFV2[25]结合了可学习树滤波器和马尔可夫随机场[16],进一步提高了性能。

方法描述:

       通过在传统的分割模型S(·)中加入一个辅助分支来实现:

       预测的掩码P被分割为已标记部分和未标记部分,分别由分割损失Lseg和树的能量损失Ltree监督,分割分支将稀疏标注的标签Y分配给被标记的像素。
       对于辅助分支,从原始图像I和嵌入的特征F中生成成对亲和矩阵 A l o w A^{low} Alow A h i g h A^{high} Ahigh,然后利用亲和矩阵 A l o w A^{low} Alow A h i g h A^{high} Ahigh采用级联过滤操作对网络预测P进行细化,生成软伪标签Y˜。生成的软标签被分配给未标记的像素。

Tree Energy Loss:
TEL主要包括以下三个步骤:
(1)一个树亲和生成步骤来建模成对关系。
(2)一个用于生成伪标签的级联过滤步骤。
(3)一个软标签分配步骤,用来为未标记的像素分配伪标签。

在这里插入图片描述

(1)树亲和生成

       树的亲和度生成的过程。首先在给定的低级颜色或高级语义特征上建立一个初始图,然后通过边缘剪枝算法[9]得到MST。在MST上,两个顶点之间的距离是通过沿其超边的边权值之和来计算的。有一个例子用红色虚线表示(如上图)。最后,利用亲和投影将距离映射投影成亲和矩阵。

       1.生成两种特征(RGB颜 色和语义特征)的无向图,获取所有相邻边的权重:
       图像可以表示为一个无向图G=(V,E),顶点集V由所有像素和两个相邻顶点之间的边缘组成边缘集E,假设顶点i和顶点j在图上相邻,它们之间的低级和高级权值函数可以分别定义为:
在这里插入图片描述
分别为像素 i i i 的RGB颜色(原图 I I I语义特征( F F F F ( i ) F(i) F(i)是由一个1×1的卷积层产生,由分割模型的分类层之前的特征产生的。

       2.删除差异较大的相邻点之间的边,获取距离图:
       从E中依次去除权值最大的边来构造一个MST。基于MST的拓扑结构,同一对象内的顶点具有相似的特征表示,并倾向于优先相互交互。
       MST的两个顶点之间的距离可以通过它们连接边的权和来计算。而顶点之间的最短路径的距离,记为超边E,形成了MST的距离图,

       j、k和m是顶点,∗∈{low,high},为了捕获顶点之间的长期关系

       3.映射为亲和矩阵:
       将距离映射映射到正亲和矩阵:

       σ是用于调节颜色信息的预设调节常量值。给定一个训练图像,低水平亲和力 A l o w A^{low} Alow是静态的,而高水平亲和力 A h i g h A^{high} Ahigh在训练过程中是动态的。它们在不同的特征级别上捕获成对的关系。通过共同利用它们,可以学习到互补的知识。

(2)级联过滤生成伪标签

       从网络预测中生成伪标签Y˜:

       P为softmax操作后的预测。通过连续地与低层次和高级的亲和度相乘,网络预测可以以粗到细的方式进行细化,产生高质量的软伪标签。通过级联过滤生成的伪标签可以比原始预测保持更清晰的语义边界。
       过滤操作F(·)表示如下:

       Ω=ΩL∪ΩU是所有像素的完整集合(ΩL:标注的像素 ΩU:未标注的像素)是归一化项。

(3)为未标记的像素分配伪标签

       软标签分配:

       δ是一个标签赋值函数,度量预测概率P和伪标签Y˜之间的距离(可以是L1距离、L2距离等)。
       TEL的最终形成就可以描述如下:

       TEL从网络预测中生成软标签。因此,数据驱动的模型学习过程将有利于我们的在线自我训练策略。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

翻译:Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation 的相关文章

  • 2023华为OD统一考试(B卷)题库清单(按算法分类),如果你时间紧迫,就按这个刷

    目录 专栏导读 华为OD机试算法题太多了 知识点繁杂 如何刷题更有效率呢 一 逻辑分析 二 数据结构 1 线性表 数组 双指针 2 map与list 3 优先队列 4 滑动窗口 5 二叉树 6 并查集 7 栈 三 算法 1 基础算法 贪心算
  • xml文件报错Unable to resolve column ‘xxx‘

    项目场景 问题描述 我在使用mybatis的逆向工程时生成的xml文件报错Unable to resolve column xxx 原因分析 需要连接到数据库 解决方案 点击右侧 填写数据库信息 点击测试 报错的话点击下放Set time
  • shell 格式化输出密码

    格式化输出 etc passwd 效果如下 root zabbix server day6 awk F BEGIN print 用户名 UID 家目录 print 1 3 6 etc passwd 用户名 UID 家目录 root 0 ro
  • Unity 移动方法总结

    Unity移动方法总结 在Unity3D中 有多重方式可以改变物体的坐标 实现移动的目的 其本质是每帧改变物体的position 通过Transform组件移动物体 Transform组件用于描述物体在空间中的状态 它包括位置 positi

随机推荐

  • transformers库的使用【二】tokenizer的使用,模型的保存自定义

    使用标记器 tokenizer 在之前提到过 标记器 tokenizer 是用来对文本进行预处理的一个工具 首先 标记器会把输入的文档进行分割 将一个句子分成单个的word 或者词语的一部分 或者是标点符号 这些进行分割以后的到的单个的wo
  • C——编译预处理

    编译预处理 1 宏定义 2 文件包含 3 条件编译 C语言提供的预处理 在编译之前进行 主要有三种 宏定义 文件包含和条件编译 预处理命令不是C语句 不用加分号 1 宏定义 形式 define 宏名 替换文本 define 宏名 参数 替换
  • Python元组、列表、字典、字符串常用方法超详细总结!!!

    文章目录 1 列表 list 1 1 len 1 2 max 和min 1 3 reverse 1 4 sort 1 5 clear 1 6 remove 1 7 insert 和pop 2 元组 tuple 2 1 len 2 2 cou
  • test2这篇博客的目的是test我做的小程序,请勿打开

    这篇博客的目的是test我做的小程序 请勿打开
  • SpringBoot多数据源动态切换,不影响业务逻辑正常运行,服务高可用

    SpringBoot多数据源动态切换 不影响业务逻辑正常运行 服务高可用 本文使用Spring Boot 2 4 10版本和MyBatis实现多数据源动态切换 当主库MySQL宕机后自动切换到容灾PostgreSQL数据库 数据库及数据表示
  • Altium Designer -- EMC/EMI电路设计经验

    一 基本概念 参看 电磁兼容原理及应用 讲的相当的不错 随着科学技术的不断发展 各种电气和电子设备已广泛应用于国民经济的各个部门以及人们的日常生活中 电气和电子设备在正常运行的同时 也往外发射有用或无用的电磁能量 这些能量会影响其它设备的正
  • 【React】dva-cli建立脚手架后引用css 无效

    用dva cli作为脚手架建立工程后 开始尝试编写页面 然后立马发现一个坑爹的问题 在我less文件里面写了一个class 比如 MainHead 但是编译出来之后发现css文件里面变成了 MainHead xuaz 多了一个后缀 坑爹嘛这
  • JavaScript 预解析(面试经常问)

    文章目录 预解析 预解析 解析器运行 JS 分为哪两步 预解析 执行代码 预解析 js 引擎会把 js里面所有 var 还有 function 提前到当前作用域的最前面 执行代码 从上到下执行 预解析分为 变量预解析 变量提升 和函数预解析
  • 数字图像处理第一二章

    什么是数字图像处理 数字图像处理是指借助于数 计算机来处理数字图像 当x y和灰度值f是有限的离散数值时 称该图像为数字图像 一幅图像可定义为一个二维函数f x y 其中x和y是空间 平面 坐标 而在任一对空间坐标 x y 处的幅值f称为图
  • infix 关键字

    infix适用于有单个参数的扩展函数 如果一个函数使用了infix 关键字 接收者和函数之间的点操作 以及参数的一对括号可以省略 fun String printWithDefault0 default String print this
  • 动态路由协议BGP配置实战

    1 边界网关协议BGP BGP是自治系统路由协议 用于AS间交换路由信息 通常使用在运营商 运营商之间或是企业 运营商之间 目前广为使用的是BGP 4 支持CIDR BGP协议使用TCP179端口传输 同一AS的路由之间传输的协议称为IBG
  • 在HAL库中NVIC中断配置

    中断优先级分组配置 void HAL NVIC SetPriorityGrouping uint32 t PriorityGroup 配置函数 define IS NVIC PRIORITY GROUP GROUP GROUP NVIC P
  • 关于监控方案的一点想法供参考

    Author Skate Time 2017 12 11 关于监控方案的一点想法供参考 1 监控目标 监控的直接目标 及时 准确的发现潜在事件 并辅助运维人员处理生产事件 消除生产事件专家和高手与一线员工的区别 监控的增值目标 通过高度的可
  • SW3516中文资料书

    SW3516 是一款高集成度的快充车充芯片 支持 A C 口任意口快充输出 支持双口独立限流 其集成了 5A 高效率同步降压变换器 支持 PPS PD QC AFC FCP SCP PE SFCP 低压直充等多种快充协议 CC CV 模式
  • unity 使用声网(Agora)实现语音通话

    第一步 先申请一个声网账号 Agora官网链接 https console shengwang cn 第二步在官网创建项目 选择无证书模式 证书模式需要tokenh和Appld才能通话 第三步 官网下载SDK 然后导入到unity 也可以直
  • VulnHubBreach1.0[渗透测试]新手必看

    靶机下载地址 https download vulnhub com breach Breach 1 0 zip 前言 将下载好的靶场导入VMware 虚拟机设置网络模式为nat模式 即可开启渗透 阅读readme txt 作为多部分系列的第
  • linux 共享存储 iostat,Linux环境下存储监控工具nfsiostat介绍

    我对Linux下存储管理和监控工具的缺乏感到非常不满 虽然如此 我还是积极在寻找适合的工具 除了等待更好的工具出现 或自己开发一款 外 我们必须好好利用现有工具的功能 sysstat监控工具家族中的一员 在以前的文章中 我曾经介绍过iost
  • mmdetection常见问题总结

    mmdetection运行以及问题总结 最近因为工作需要 跑了下mmdetection 复现了论文的精度 总结下其中遇到的问题 希望对大家有帮助哦 1 环境设置 操作系统 ubuntu16 04 python3 7 pytorch1 6 0
  • HYSBZ bzoj 1941 Hide and Seek

    Problem www lydsy com JudgeOnline problem php id 1941 vjudge net contest 187908 problem B Reference BZOJ1941 Sdoi2010 Hi
  • 翻译:Tree Energy Loss: Towards Sparsely Annotated Semantic Segmentation

    目录 摘要 介绍 方法描述 1 树亲和生成 2 级联过滤生成伪标签 3 为未标记的像素分配伪标签 文章地址 Tree Energy Loss Towards Sparsely Annotated Semantic Segmentation