【语义分割】【CVPR2022】BAM Note

2023-11-17

Topic

这是一篇CVPR 2022 Oral Paper,让我们继续体会小样本分割的魅力
在这里插入图片描述

Abstract

  • 近年来,少镜头分割技术得到了广泛的发展。以往的工作大多试图通过分类任务的元学习框架来实现泛化,然而,训练的模型偏向于所见的类,而不是理想的类不可知,从而阻碍了对新概念的识别。
  • 本文提出了一种新的、直截了当的观点来缓解这一问题。具体地说,我们在传统的FSS模型(元学习器)上增加了一个分支(基学习器)来明确地识别基类的目标,即不需要分割的区域。然后,这两个学习器并行输出的粗略结果被自适应地整合,以产生精确的分割预测。考虑到元学习器的敏感性,我们进一步引入了调整因子来估计输入图像对之间的场景差异,以便于模型集成预测。
  • 在PASCAL-5i和COCO-20i上的大幅性能提升验证了有效性,令人惊讶的是,我们的多功能方案甚至在两个普通learners的情况下也设置了新的最先进的水平。此外,鉴于该方法的独特性,我们还将其扩展到一种更现实但更具挑战性的环境,即广义FSS,其中需要确定基类和新类的像素。
    在这里插入图片描述

论文创新点 (Create point)

  • 我们认为,除了设计更强大的特征提取模块外,调整包含足够训练样本的基础数据集的使用也是缓解上述偏差问题的一种替代方法,而这一问题在以往的工作中被忽视了。为此,我们在传统的FSS模型(元学习器)中引入了一个额外的分支(基本学习器)来显式预测基类的目标(见图1)。然后,这两个学习器并行输出的粗略结果被自适应地整合以生成准确的预测。这种操作背后的中心洞察力是通过在传统范例内训练的大容量分割模型来识别查询图像中的易混淆区域,从而进一步促进对新对象的识别。顺便提一句,该方案被命名为BAM,因为它由两个唯一的学习器组成,base and the meta.即基本学习器和元学习器。

Contribution:

  • 我们提出了一种简单而有效的方案来解决偏差问题,方法是引入额外的分支来显式地预测查询图像中基类的区域,这对未来的工作具有启发意义。
  • 我们建议通过Gram矩阵估计查询-支持图像对之间的场景差异,以减轻元学习者敏感性带来的不利影响。
  • 我们的通用方案在所有环境下设置了新的FSS基准,即使有两个普通的学习者也是如此。
  • 我们将所提出的方法扩展到更具挑战性的环境,即广义FSS,它同时识别基础类和新类的目标。

少镜头分割的目的是利用较少的标记数据进行分割。目前的方法通常在元学习范式下训练模型,也称为情景训练。具体地说,给定两个在对象类别方面互不相交的图像集DTrain和Dtest,模型期望在具有足够标注样本的DTrain上学习可传递的知识,从而在具有较少标注样本的Dtest上表现出良好的泛化能力。具体地说,这两个集合都由许多情节组成,每个情节都包含一个小支持集={(xsi,msi)}ki=1和一个查询集q={(xq,mq)},其中x∗和m∗分别表示特定类别c的原始图像及其对应的二进制掩码。在每个训练集中对模型进行优化,以在支持集S的条件下对查询图像XQ进行预测。一旦训练完成,我们将评估它们在所有测试集中的Dtest上的少镜头分割性能,而不需要进一步的优化。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【语义分割】【CVPR2022】BAM Note 的相关文章

随机推荐

  • 5G承载网络技术发展趋势

    导读 随着5G建设的日渐加快 5G与云网融合共生互促 推动承载网络技术不断发展演进 云网融合必将成为行业高质量发展的必然趋势 当前云网融合面临着新需求与新挑战 5G承载网络技术在确定性保障 定制化服务和智能管控运维等技术方面也面临着新的发展
  • 5个最流行的可用于移动开发的嵌入式数据库简介

    嵌入式数据库是轻量级的 独立的库 没有服务器组件 无需管理 一个小的代码尺寸 以及有限的资源需求 目前有几种嵌入式数据库 你可以在移动应用程序中使用 让我们来看看这些最流行的数据库 数据库 数据类型存储 License 支持平台 Berke
  • 【2019.11.12】C语言中求最大值和最小值的两种方法

    C语言中求最大值和最小值的两种方法 编写完整的程序 输入三个数 输出其中的最大数 最小数 输入说明 两个整数N1 N2 N3 输出说明 最大数 最小数 输入样例 5 4 9 输出样例 9 4 方法一 include
  • C++学习教程大纲

    以下是C 学习教程的大纲 第一部分 基础知识 C 简介 什么是C C 的历史 C 的特点和优势 开发环境的搭建 安装C 编译器 配置开发环境 第一个C 程序 Hello World程序 程序的结构 编译和运行程序 数据类型和变量 基本数据类
  • jQuery的三种$()

    号是jQuery 类 的一个别称 构造了一个jQuery对象 所以 可以叫做jQuery的构造函数 个人观点 呵呵 1 可以是 expresion 即css选择器 Xpath或html元素 也就是通过上述表达式来匹配目标元素 比如 a 构造
  • 应急响应篇:windows入侵排查

    前言 应急响应 Incident Response Service IRS 是当企业系统遭受病毒传播 网络攻击 黑客入侵等安全事件导致信息业务中断 系统宕机 网络瘫痪 数据丢失 企业声誉受损 并对组织和业务运行产生直接或间接的负面影响时 急
  • 《码上行动:零基础学会Python编程》书籍分享

    Python是一种高级的 面向对象的编程语言 由Guido van Rossum于1991年开发 它具有简洁 易读和可维护的语法 被广泛用于科学计算 Web开发 数据分析 人工智能等领域 以下是Python的一些特点和优势 简洁易读 Pyt
  • 还对Flutter理解不透?看完这些迟早成为大佬~

    Flutter是什么 Flutter简介 Flutter是谷歌的移动UI框架 可以快速在iOS和Android上构建高质量的原生用户界面 一份代码可以同时生成iOS和Android两个高性能 高保真的应用程序 Flutter目标是使开发人员
  • 2023年最火副业:Python爬虫兼职,一周赚7800元,一天只要两小时 !

    现在学习python的人越来越多了 跟大家简单如何利用python搞副业赚钱的 想要利用 Python 赚钱的方式还是比较多的 其中接单和投稿算是两种比较简单的方式了 如果你是业余学python爬虫 可以去淘宝上加了找了几个店铺直接问需要爬
  • 数据结构和算法(4):栈与队列

    栈 ADT 及实现 栈 stack 是存放数据对象的一种特殊容器 其中的数据元素按线性的逻辑次序排列 故也可定义首 末元素 尽管栈结构也支持对象的插入和删除操作 但其操作的范围仅限于栈的某一特定端 也就是说 若约定新的元素只能从某一端插入其
  • 文本域左边的文字处理

    文本域左边文字默认是bottom 如果想要左边文字与文本域顶部平齐 那么只需要设置label的vertical align的属性值为top即可 设置前 设置后
  • 代码分析(一)

    2021SC SDUSC 分析前言 对于APIJSON的代码分析首先就是 看一下该项目的作用以及如何进行 看一下原来不部署这个项目的正常流程 再来看一下部署上APIJSON后项目的流程走向 接下来开始按照这个流程对相应的代码进行分析 Abs
  • windows xcopy 复制文件夹命令 覆盖 或 跳过

    xcopy 拓展的复制命令 复制目录和下面的文件 保持目录结构 不能复制系统文件 隐藏文件 xcopy 源路径 目标路径 常用 复制并且覆盖 xcopy y srcPath dstPath 复制目录和目录下文件并且对目录下的子目录和子目录的
  • 一款好用的国产软件源代码缺陷分析平台 — CodeSense

    CodeSense是新一代的软件源代码缺陷深度分析平台 包含多个自研的代码分析引擎 同时提供开放的方案 支持多种商业 开源分析引擎集成并对结果进行集中展示 与目前市面的国外商业工具对比 在语言种类 功能 标准 缺陷分类数量上 已达到一致 额
  • 论文阅读-Training a Helpful and Harmless Assistant withReinforcement Learning from Human Feedback

    一 论文信息 论文名称 Training a Helpful and Harmless Assistant withReinforcement Learning from Human Feedback Github GitHub anthr
  • JavaWeb - 仿小米商场(4):首页商品分类展示

    JavaWeb 仿小米商场 4 首页线路分类展示 1 功能描述 接上篇JavaWeb 仿小米商场 3 登录与退出本篇博客将分析和实现旅游线路分类内容的查询和展示 此功能旨在控制 banner 顶部的展示内容 如以下H5页面所示 2 功能分析
  • Uniapp零基础开发学习笔记(9) -媒体组件音视频摄像头等的练习使用

    Uniapp零基础开发学习笔记 9 媒体组件音视频摄像头等的练习使用 基础组件部分 最后就只剩余媒体组件以及地图 和画布Canvas 以及浏览器组件web view 此次先看看媒体组件 重点学习前面几个 链接如下 https uniapp
  • 在Vue中当执行this.$emit() 时发生了什么?this.$emit() 的调用是异步的吗?

    当在Vue组件中调用this e m i t 时 实 际
  • 局域网设计

    一 局域网设计模型 1 局域网设计原则 考察物理链路 物理链路的带宽是网络设计的基础 分析数据流的特征 明确应用和数据流的分布特征 可以更加有效地进行资源分布 例如 企业邮件服务和工作组共享打印对于网络的需求是不一致的 采用层次化模型进行设
  • 【语义分割】【CVPR2022】BAM Note

    Topic 这是一篇CVPR 2022 Oral Paper 让我们继续体会小样本分割的魅力 Abstract 近年来 少镜头分割技术得到了广泛的发展 以往的工作大多试图通过分类任务的元学习框架来实现泛化 然而 训练的模型偏向于所见的类 而