【语义分割】【CVPR2022】BAM Note

2023-11-17

Topic

这是一篇CVPR 2022 Oral Paper，让我们继续体会小样本分割的魅力
在这里插入图片描述

Abstract

近年来，少镜头分割技术得到了广泛的发展。以往的工作大多试图通过分类任务的元学习框架来实现泛化，然而，训练的模型偏向于所见的类，而不是理想的类不可知，从而阻碍了对新概念的识别。
本文提出了一种新的、直截了当的观点来缓解这一问题。具体地说，我们在传统的FSS模型(元学习器)上增加了一个分支(基学习器)来明确地识别基类的目标，即不需要分割的区域。然后，这两个学习器并行输出的粗略结果被自适应地整合，以产生精确的分割预测。考虑到元学习器的敏感性，我们进一步引入了调整因子来估计输入图像对之间的场景差异，以便于模型集成预测。
在PASCAL-5i和COCO-20i上的大幅性能提升验证了有效性，令人惊讶的是，我们的多功能方案甚至在两个普通learners的情况下也设置了新的最先进的水平。此外，鉴于该方法的独特性，我们还将其扩展到一种更现实但更具挑战性的环境，即广义FSS，其中需要确定基类和新类的像素。

论文创新点 (Create point)

我们认为，除了设计更强大的特征提取模块外，调整包含足够训练样本的基础数据集的使用也是缓解上述偏差问题的一种替代方法，而这一问题在以往的工作中被忽视了。为此，我们在传统的FSS模型(元学习器)中引入了一个额外的分支(基本学习器)来显式预测基类的目标(见图1)。然后，这两个学习器并行输出的粗略结果被自适应地整合以生成准确的预测。这种操作背后的中心洞察力是通过在传统范例内训练的大容量分割模型来识别查询图像中的易混淆区域，从而进一步促进对新对象的识别。顺便提一句，该方案被命名为BAM，因为它由两个唯一的学习器组成，base and the meta.即基本学习器和元学习器。

Contribution:

我们提出了一种简单而有效的方案来解决偏差问题，方法是引入额外的分支来显式地预测查询图像中基类的区域，这对未来的工作具有启发意义。
我们建议通过Gram矩阵估计查询-支持图像对之间的场景差异，以减轻元学习者敏感性带来的不利影响。
我们的通用方案在所有环境下设置了新的FSS基准，即使有两个普通的学习者也是如此。
我们将所提出的方法扩展到更具挑战性的环境，即广义FSS，它同时识别基础类和新类的目标。

少镜头分割的目的是利用较少的标记数据进行分割。目前的方法通常在元学习范式下训练模型，也称为情景训练。具体地说，给定两个在对象类别方面互不相交的图像集D_Train和D_test，模型期望在具有足够标注样本的D_Train上学习可传递的知识，从而在具有较少标注样本的D_test上表现出良好的泛化能力。具体地说，这两个集合都由许多情节组成，每个情节都包含一个小支持集={(xsi，msi)}ki=1和一个查询集q={(xq，mq)}，其中x∗和m∗分别表示特定类别c的原始图像及其对应的二进制掩码。在每个训练集中对模型进行优化，以在支持集S的条件下对查询图像XQ进行预测。一旦训练完成，我们将评估它们在所有测试集中的Dtest上的少镜头分割性能，而不需要进一步的优化。

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【语义分割】【CVPR2022】BAM Note 的相关文章

【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
面对AI革新时，Soul App等社交应用的“出圈”解法是什么？

2023年初 ChatGPT掀开海内外互联网 AI革新的序幕公众在惊讶于ChatGPT对于海量信息富有逻辑的整合归纳帮助大家提升工作及学习效率之余更为期待的莫过于有一天人工智能的意识觉醒十余年前由斯派克琼斯 Spike Jon
扬帆证券：三只松鼠去年扣非净利预增超1.4倍

在高端性价比战略驱动下三只松鼠 300783 重拾增势 1月15日晚间三只松鼠发布成绩预告预计2023年度净赢利为2亿元至2 2亿元同比增加54 97 至70 47 扣非后净赢利为1亿元至1 1亿元同比增速达146 9 至17
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
基于opencv的大米计数统计（详细处理流程＋代码）

在我每周的标准作业清单中有一项是编写计算机视觉算法来计算该图像中米粒的数量因此当我的一个好朋友M给我发了一张纸上的扁豆照片显然是受到上述转发的启发请我帮他数一下谷物的数量时它勾起了我怀旧的回忆因此我在我的旧硬盘上寻找很久以前
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
毕业设计：基于卷积神经网络的验证码识别系统机器视觉人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 字符分割算法 2 2 深度学习三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
毕业设计：基于卷积神经网络的图像分类系统 python人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 卷积神经网络 2 2 SVM算法三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
如何快速申请GPT账号？

详情点击链接如何快速申请GPT账号一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemini以及大模型
手把手教你用 Stable Diffusion 写好提示词

Stable Diffusion 技术把 AI 图像生成提高到了一个全新高度文生图 Text to image 生成质量很大程度上取决于你的提示词 Prompt 好不好前面文章写了一篇文章一份保姆级的 Stable Diffusion
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩

随机推荐

5G承载网络技术发展趋势

导读随着5G建设的日渐加快 5G与云网融合共生互促推动承载网络技术不断发展演进云网融合必将成为行业高质量发展的必然趋势当前云网融合面临着新需求与新挑战 5G承载网络技术在确定性保障定制化服务和智能管控运维等技术方面也面临着新的发展
5个最流行的可用于移动开发的嵌入式数据库简介

嵌入式数据库是轻量级的独立的库没有服务器组件无需管理一个小的代码尺寸以及有限的资源需求目前有几种嵌入式数据库你可以在移动应用程序中使用让我们来看看这些最流行的数据库数据库数据类型存储 License 支持平台 Berke
【2019.11.12】C语言中求最大值和最小值的两种方法

C语言中求最大值和最小值的两种方法编写完整的程序输入三个数输出其中的最大数最小数输入说明两个整数N1 N2 N3 输出说明最大数最小数输入样例 5 4 9 输出样例 9 4 方法一 include
C++学习教程大纲

以下是C 学习教程的大纲第一部分基础知识 C 简介什么是C C 的历史 C 的特点和优势开发环境的搭建安装C 编译器配置开发环境第一个C 程序 Hello World程序程序的结构编译和运行程序数据类型和变量基本数据类
jQuery的三种$()

号是jQuery 类的一个别称构造了一个jQuery对象所以可以叫做jQuery的构造函数个人观点呵呵 1 可以是 expresion 即css选择器 Xpath或html元素也就是通过上述表达式来匹配目标元素比如 a 构造
应急响应篇：windows入侵排查

前言应急响应 Incident Response Service IRS 是当企业系统遭受病毒传播网络攻击黑客入侵等安全事件导致信息业务中断系统宕机网络瘫痪数据丢失企业声誉受损并对组织和业务运行产生直接或间接的负面影响时急
《码上行动：零基础学会Python编程》书籍分享

Python是一种高级的面向对象的编程语言由Guido van Rossum于1991年开发它具有简洁易读和可维护的语法被广泛用于科学计算 Web开发数据分析人工智能等领域以下是Python的一些特点和优势简洁易读 Pyt
还对Flutter理解不透？看完这些迟早成为大佬~

Flutter是什么 Flutter简介 Flutter是谷歌的移动UI框架可以快速在iOS和Android上构建高质量的原生用户界面一份代码可以同时生成iOS和Android两个高性能高保真的应用程序 Flutter目标是使开发人员
2023年最火副业：Python爬虫兼职，一周赚7800元，一天只要两小时！

现在学习python的人越来越多了跟大家简单如何利用python搞副业赚钱的想要利用 Python 赚钱的方式还是比较多的其中接单和投稿算是两种比较简单的方式了如果你是业余学python爬虫可以去淘宝上加了找了几个店铺直接问需要爬
数据结构和算法（4）：栈与队列

栈 ADT 及实现栈 stack 是存放数据对象的一种特殊容器其中的数据元素按线性的逻辑次序排列故也可定义首末元素尽管栈结构也支持对象的插入和删除操作但其操作的范围仅限于栈的某一特定端也就是说若约定新的元素只能从某一端插入其
文本域左边的文字处理

文本域左边文字默认是bottom 如果想要左边文字与文本域顶部平齐那么只需要设置label的vertical align的属性值为top即可设置前设置后
代码分析（一）

2021SC SDUSC 分析前言对于APIJSON的代码分析首先就是看一下该项目的作用以及如何进行看一下原来不部署这个项目的正常流程再来看一下部署上APIJSON后项目的流程走向接下来开始按照这个流程对相应的代码进行分析 Abs
windows xcopy 复制文件夹命令覆盖或跳过

xcopy 拓展的复制命令复制目录和下面的文件保持目录结构不能复制系统文件隐藏文件 xcopy 源路径目标路径常用复制并且覆盖 xcopy y srcPath dstPath 复制目录和目录下文件并且对目录下的子目录和子目录的
一款好用的国产软件源代码缺陷分析平台 — CodeSense

CodeSense是新一代的软件源代码缺陷深度分析平台包含多个自研的代码分析引擎同时提供开放的方案支持多种商业开源分析引擎集成并对结果进行集中展示与目前市面的国外商业工具对比在语言种类功能标准缺陷分类数量上已达到一致额
论文阅读-Training a Helpful and Harmless Assistant withReinforcement Learning from Human Feedback

一论文信息论文名称 Training a Helpful and Harmless Assistant withReinforcement Learning from Human Feedback Github GitHub anthr
JavaWeb - 仿小米商场（4）：首页商品分类展示

JavaWeb 仿小米商场 4 首页线路分类展示 1 功能描述接上篇JavaWeb 仿小米商场 3 登录与退出本篇博客将分析和实现旅游线路分类内容的查询和展示此功能旨在控制 banner 顶部的展示内容如以下H5页面所示 2 功能分析
Uniapp零基础开发学习笔记(9) -媒体组件音视频摄像头等的练习使用

Uniapp零基础开发学习笔记 9 媒体组件音视频摄像头等的练习使用基础组件部分最后就只剩余媒体组件以及地图和画布Canvas 以及浏览器组件web view 此次先看看媒体组件重点学习前面几个链接如下 https uniapp
在Vue中当执行this.$emit() 时发生了什么?this.$emit() 的调用是异步的吗？

当在Vue组件中调用this e m i t 时实际
局域网设计

一局域网设计模型 1 局域网设计原则考察物理链路物理链路的带宽是网络设计的基础分析数据流的特征明确应用和数据流的分布特征可以更加有效地进行资源分布例如企业邮件服务和工作组共享打印对于网络的需求是不一致的采用层次化模型进行设
【语义分割】【CVPR2022】BAM Note

Topic 这是一篇CVPR 2022 Oral Paper 让我们继续体会小样本分割的魅力 Abstract 近年来少镜头分割技术得到了广泛的发展以往的工作大多试图通过分类任务的元学习框架来实现泛化然而训练的模型偏向于所见的类而