SOLO算法解读

2023-11-20

论文:SOLO: Segmenting Objects by Locations
论文链接:https://arxiv.org/abs/1912.04488

代码链接:GitHub - WXinlong/SOLO: SOLO and SOLOv2 for instance segmentation, ECCV 2020 & NeurIPS 2020.

核心:预测每个像素所在的物体的实例类别。

作者指出实例类别就是量化后的物体中心位置和物体的尺寸,通过位置和形状进行区分实例,同一中心位置,同一尺寸物体为同一实例,否则为不同类别。

网络结构

网络结构如图2所示:

原图经过FCN网络生成feature map,分别送入网络两个分支,Semantic Category以及Instance Mask,Semantic Category分支feature map为S*S*C,用于预测各个位置目标的的类别,C为类别数。Instance Mask分支feature map为H*W*S^2,因为Instance Mask分支有S^2个位置,因此Instance Mask分支会生成S^2个H*W的feature map,用于目标的全图位置预测。

为检测不同尺度目标,引入FPN,每层输出各自接入以上两个分支。

Semantic Category

经过fpn得到的feature map为H*W经过上采样变为S*S,可通过三种方法:

1、直接双线性差值

2、adpative pooling

3、区域网格插值

经作者实验,三种方法差别不大。

正负样本设置:网格落到中心区域则为正样本,否则为负样本。给出真值mask的cx,cy,w,h;中心区域为(cx, cy, 0.2w, 0.2h),设置为0.2时,每个真值mask平均生成3个正样本。

Instance Mask

Instance Mask生成H*W*S^2的feature map,Semantic Category每个位置都会对应于实例mask分支中每一个channel,用于生成目标的mask。

因为FCN在一定程度上具有空间不变性,因此在FCN基础上增加两个channel,增加坐标信息,将像素横纵坐标x,y,归一化到[-1,1],如图3所示,将FCN生成特征图H*W*256增加2个 channel。

损失函数

Lcate采用Focal Loss(FL)

Lmask如公式2所示,

dmask作者尝试了BCE、FL以及Dice loss(DL),发现DL优于FL优于BCE。

FL比BCE效果好,主要是因为一个实例分割mask中大多数像素在背景上,FL可以削弱样本不均衡问题,通过降低分类效果好的样本的loss。DL将整张图看作一个目标,能够创建前景与背景之间平衡,且不需要超参数。如公式3、4所示。

实验结果

SOLO解耦

Instance Mask分支channel为S×S,这对计算量是比较大的要求,但其实图片中通常并不会有这么多的实例,因此有很多通道是多余的。对此作者将通道变为2S,如图7所示。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

SOLO算法解读 的相关文章

  • Ubuntu - OpenSSH安装或升级

    1 准备安装包 openssl 1 0 2o tar gz wget https www openssl org source openssl 1 0 2o tar gz https www openssl org source opens
  • 插入排序超详解释,一看就懂

    目录 一 插入排序的相关概念 1 基本思想 2 基本操作 有序插入 二 插入排序的种类 三 直接插入排序 1 直接插入排序的过程 顺序查找法查找插入位置 2 使用 哨兵 直接插入排序 四 直接插入排序算法描述 五 折半插入排序 1 查找插入
  • linux 操作mysql 命令_linux下mysql操作命令大全

    Linux下掌握基本的mysql操作命令大全能够为你学习linux中mysql提供更好的帮助 下面由学习啦小编为大家整理了linux下mysql操作命令大全的相关知识 希望对大家有帮助 linux的mysql操作命令大全详解 linux的m
  • uniapp.request遇到的坑

    uniapp request遇到的坑 发起post请求的时候data接收不到参数 解决 发起请求中添加 uni request header content type application x www form urlencoded

随机推荐

  • 索引优化之Explain 及慢查询日志

    索引 本质是数据结构 简单理解为 排好序的快速查找数据结构 以索引文件的形式存储在磁盘中 目的 提高数据查询的效率 优化查询性能 就像书的目录一样 优势 提高检索效率 降低IO成本 排好序的表 降低CPU的消耗劣势 索引实际也是一张表 该表
  • Java 实现MySQL数据库插入1000万条数据

    Java 实现MySQL数据库插入1000万条数据 针对某些特殊测试 需要添加大量数据 且这些测试具有一定的规律性 可以按照以下的sql脚本循环添加 可以是1000条 也可以是一百万条 Java实现 准备表一张 CREATE TABLE t
  • 日志清理脚本

    需求背景 解决某些中间件或者应用日志无法自动清理的情况 比如 Nacos 的 access 日志清理 临时目录文件清理等 简介 Filename clear logs sh Revision 0 0 3 Date 2020 06 05 Au
  • 探究Xcode New Build System对于构建速度的提升

    在Xcode9发布的时候 Apple在Build System上提供了新版本的构建系统 New Build System 具体可见WWDC2017 不过令人失望的是 该新特性的讲解很简短 短到只在一页PPT上露脸 在这短短的时间里 苹果讲述
  • Python 生成器如何设置和使用

    Python 的生成器其实可以理解为一种比较复杂的迭代器 关于迭代器 可以参考 Python 迭代器的设置和使用方法 一 代码举例 def gen x y txt I love x yield txt txt 1 You love y yi
  • 作用域和内存问题

    文章目录 一 基本类型和引用类型的值 基本类型和引用类型的区别 1 动态的属性 2 复制变量值 3 传递参数 4 监测类型 二 执行环境及作用域 1 延长作用域链 2 没有块级作用域 一 基本类型和引用类型的值 变量可能包括两种不同的数据类
  • 【Docker】之安装 Redis

    一 下载 Redis 镜像 下载最新版 Redis 镜像 默认版本为 latest docker pull redis 更多版本镜像 1 访问 Docker 官网 https hub docker com 在镜像搜索栏中输入 Redist
  • flea-auth使用之用户子模块介绍

    用户子模块 本篇主要介绍笔者 授权模块 flea auth 下的用户子模块 1 总览 表名 中文描述 flea account 账户 flea account attr 账户扩展属性 flea user 用户 flea user attr
  • libevent的消息传递和回调注册函数

    参考原帖地址 https www cnblogs com secondtonone1 p 5554075 html 1 evconnlistener new bind函数 1 evconnlistener new bind 完成socket
  • JDK8下载安装

    参考 JDK8下载安装教程 涵涵想养猫的博客 CSDN博客 jdk8下载安装 下载地址 https www oracle com java technologies javase javase jdk8 downloads html 根据需
  • python 中 os._exit(), sys.exit()

    1 os exit 不抛异常 后面的代码就不执行了 不执行相关清理工作 直接退出 Python 解释器一般来说用在子线程中退出 2 sys exit 引发一个 SystemExit 异常 没有捕获这个异常 会直接退出 捕获这个异常可以做一些
  • 软考:中级软件设计师:程序语言基础:表达式,标准分类,法律法规,程序语言特点,函数传值传址

    软考 中级软件设计师 程序语言基础 表达式 提示 系列被面试官问的问题 我自己当时不会 所以下来自己复盘一下 认真学习和总结 以应对未来更多的可能性 关于互联网大厂的笔试面试 都是需要细心准备的 1 自己的科研经历 科研内容 学习的相关领域
  • 禁止ios浏览器页面上下滚动 (橡皮筋效果)弹性滚动 微信的下拉回弹

    发现之前阻止页面滚动的代码e preventDefault代码失效了 于是自己折腾了一番 找到了解决办法 一 前言 浏览器在移动端有一个默认触摸滚动的效果 让我们感触最深的莫过于微信浏览器里面 下拉时自带橡皮筋的效果 然而在开发的时候我们经
  • 软件测试日常分享

    以下是测试主管 测试经理 质量保证经理的面试问题和答案 供新人和有经验的求职者获得他们梦想的工作 1 测试经理的职责是什么 QA经理的角色包括 从启动到结束管理项目 测试计划 获得客户对交付成果的认可 向客户端批准中间交付物和补丁发布 提交
  • 动手学深度学习——softmax回归(原理解释+代码详解)

    目录 1 softmax回归 1 1 分类问题 1 2 网络架构 1 3 全连接层的参数开销 1 4 softmax运算 1 5 小批量样本的矢量化 1 6 损失函数 1 6 1 对数似然 1 6 2 softmax及其导数 1 6 3 交
  • 算法导论 学习笔记 第七章 快速排序

    快排最坏时间复杂度为 n 但它的平均性能很好 通常是实际排序应用中最好的选择 它的期望时间复杂度为 nlgn 且 nlgn 中隐含的常数因子非常小 且它还能进行原址排序 快排也使用了分治思想 1 分解 数组被划分为两个子数组 使得一个子数组
  • 服务器如何开多个虚拟机,服务器运行多个虚拟机

    服务器运行多个虚拟机 内容精选 换一换 通过内网连接云手机实例时 需要在租户VPC中创建一台弹性云服务器 作为连接云手机的跳板机器 若创建云手机服务器时未使用自定义网络 还需在云手机租户的VPC和服务器所在VPC之间建立对等连接 如图1所示
  • SpringBoot集成Netty时在Handler类中注入service和dao为null

    最近在做一个服务器接收客户端消息 之前一直都只接触web开发 第一次接触服务器开发 接触到Netty 但在Netty的Handler类里注入为null public class HttpRequestHandler extends Simp
  • 【vue3练习 -12】vue3使用readonly(),shallowReadonly()

    作用 把一个响应式 可以是ref定义的 也可以是reactive定义的 的数据变成只读的 不可以修改 使用场景 假如你的组件有个数据 但是你不希望在使用的时候修改他就可以把他变成只读的 用法示例 import readonly shallo
  • SOLO算法解读

    论文 SOLO Segmenting Objects by Locations 论文链接 https arxiv org abs 1912 04488 代码链接 GitHub WXinlong SOLO SOLO and SOLOv2 fo