SOLO算法解读

2023-11-20

论文：SOLO: Segmenting Objects by Locations
论文链接：https://arxiv.org/abs/1912.04488

代码链接：GitHub - WXinlong/SOLO: SOLO and SOLOv2 for instance segmentation, ECCV 2020 & NeurIPS 2020.

核心：预测每个像素所在的物体的实例类别。

作者指出实例类别就是量化后的物体中心位置和物体的尺寸，通过位置和形状进行区分实例，同一中心位置，同一尺寸物体为同一实例，否则为不同类别。

网络结构

网络结构如图2所示：

原图经过FCN网络生成feature map，分别送入网络两个分支，Semantic Category以及Instance Mask，Semantic Category分支feature map为S*S*C，用于预测各个位置目标的的类别，C为类别数。Instance Mask分支feature map为H*W*S^2，因为Instance Mask分支有S^2个位置，因此Instance Mask分支会生成S^2个H*W的feature map，用于目标的全图位置预测。

为检测不同尺度目标，引入FPN，每层输出各自接入以上两个分支。

Semantic Category

经过fpn得到的feature map为H*W经过上采样变为S*S，可通过三种方法：

1、直接双线性差值

2、adpative pooling

3、区域网格插值

经作者实验，三种方法差别不大。

正负样本设置：网格落到中心区域则为正样本，否则为负样本。给出真值mask的cx，cy，w，h；中心区域为(cx, cy, 0.2w, 0.2h)，设置为0.2时，每个真值mask平均生成3个正样本。

Instance Mask

Instance Mask生成H*W*S^2的feature map，Semantic Category每个位置都会对应于实例mask分支中每一个channel，用于生成目标的mask。

因为FCN在一定程度上具有空间不变性，因此在FCN基础上增加两个channel，增加坐标信息，将像素横纵坐标x，y，归一化到[-1,1]，如图3所示，将FCN生成特征图H*W*256增加2个 channel。

损失函数

Lcate采用Focal Loss（FL）

Lmask如公式2所示，

dmask作者尝试了BCE、FL以及Dice loss（DL），发现DL优于FL优于BCE。

FL比BCE效果好，主要是因为一个实例分割mask中大多数像素在背景上，FL可以削弱样本不均衡问题，通过降低分类效果好的样本的loss。DL将整张图看作一个目标，能够创建前景与背景之间平衡，且不需要超参数。如公式3、4所示。

实验结果

SOLO解耦

Instance Mask分支channel为S×S，这对计算量是比较大的要求，但其实图片中通常并不会有这么多的实例，因此有很多通道是多余的。对此作者将通道变为2S，如图7所示。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

实例分割

论文详解

深度学习

计算机视觉

solo

SOLO算法解读的相关文章

Ubuntu - OpenSSH安装或升级

1 准备安装包 openssl 1 0 2o tar gz wget https www openssl org source openssl 1 0 2o tar gz https www openssl org source opens
插入排序超详解释，一看就懂

目录一插入排序的相关概念 1 基本思想 2 基本操作有序插入二插入排序的种类三直接插入排序 1 直接插入排序的过程顺序查找法查找插入位置 2 使用哨兵直接插入排序四直接插入排序算法描述五折半插入排序 1 查找插入
linux 操作mysql 命令_linux下mysql操作命令大全

Linux下掌握基本的mysql操作命令大全能够为你学习linux中mysql提供更好的帮助下面由学习啦小编为大家整理了linux下mysql操作命令大全的相关知识希望对大家有帮助 linux的mysql操作命令大全详解 linux的m
uniapp.request遇到的坑

uniapp request遇到的坑发起post请求的时候data接收不到参数解决发起请求中添加 uni request header content type application x www form urlencoded

随机推荐

索引优化之Explain 及慢查询日志

索引本质是数据结构简单理解为排好序的快速查找数据结构以索引文件的形式存储在磁盘中目的提高数据查询的效率优化查询性能就像书的目录一样优势提高检索效率降低IO成本排好序的表降低CPU的消耗劣势索引实际也是一张表该表
Java 实现MySQL数据库插入1000万条数据

Java 实现MySQL数据库插入1000万条数据针对某些特殊测试需要添加大量数据且这些测试具有一定的规律性可以按照以下的sql脚本循环添加可以是1000条也可以是一百万条 Java实现准备表一张 CREATE TABLE t
日志清理脚本

需求背景解决某些中间件或者应用日志无法自动清理的情况比如 Nacos 的 access 日志清理临时目录文件清理等简介 Filename clear logs sh Revision 0 0 3 Date 2020 06 05 Au
探究Xcode New Build System对于构建速度的提升

在Xcode9发布的时候 Apple在Build System上提供了新版本的构建系统 New Build System 具体可见WWDC2017 不过令人失望的是该新特性的讲解很简短短到只在一页PPT上露脸在这短短的时间里苹果讲述
Python 生成器如何设置和使用

Python 的生成器其实可以理解为一种比较复杂的迭代器关于迭代器可以参考 Python 迭代器的设置和使用方法一代码举例 def gen x y txt I love x yield txt txt 1 You love y yi
作用域和内存问题

文章目录一基本类型和引用类型的值基本类型和引用类型的区别 1 动态的属性 2 复制变量值 3 传递参数 4 监测类型二执行环境及作用域 1 延长作用域链 2 没有块级作用域一基本类型和引用类型的值变量可能包括两种不同的数据类
【Docker】之安装 Redis

一下载 Redis 镜像下载最新版 Redis 镜像默认版本为 latest docker pull redis 更多版本镜像 1 访问 Docker 官网 https hub docker com 在镜像搜索栏中输入 Redist
flea-auth使用之用户子模块介绍

用户子模块本篇主要介绍笔者授权模块 flea auth 下的用户子模块 1 总览表名中文描述 flea account 账户 flea account attr 账户扩展属性 flea user 用户 flea user attr
libevent的消息传递和回调注册函数

参考原帖地址 https www cnblogs com secondtonone1 p 5554075 html 1 evconnlistener new bind函数 1 evconnlistener new bind 完成socket
JDK8下载安装

参考 JDK8下载安装教程涵涵想养猫的博客 CSDN博客 jdk8下载安装下载地址 https www oracle com java technologies javase javase jdk8 downloads html 根据需
python 中 os._exit()， sys.exit()

1 os exit 不抛异常后面的代码就不执行了不执行相关清理工作直接退出 Python 解释器一般来说用在子线程中退出 2 sys exit 引发一个 SystemExit 异常没有捕获这个异常会直接退出捕获这个异常可以做一些
软考：中级软件设计师:程序语言基础：表达式，标准分类，法律法规，程序语言特点，函数传值传址

软考中级软件设计师程序语言基础表达式提示系列被面试官问的问题我自己当时不会所以下来自己复盘一下认真学习和总结以应对未来更多的可能性关于互联网大厂的笔试面试都是需要细心准备的 1 自己的科研经历科研内容学习的相关领域
禁止ios浏览器页面上下滚动 (橡皮筋效果)弹性滚动微信的下拉回弹

发现之前阻止页面滚动的代码e preventDefault代码失效了于是自己折腾了一番找到了解决办法一前言浏览器在移动端有一个默认触摸滚动的效果让我们感触最深的莫过于微信浏览器里面下拉时自带橡皮筋的效果然而在开发的时候我们经
软件测试日常分享

以下是测试主管测试经理质量保证经理的面试问题和答案供新人和有经验的求职者获得他们梦想的工作 1 测试经理的职责是什么 QA经理的角色包括从启动到结束管理项目测试计划获得客户对交付成果的认可向客户端批准中间交付物和补丁发布提交
动手学深度学习——softmax回归（原理解释+代码详解）

目录 1 softmax回归 1 1 分类问题 1 2 网络架构 1 3 全连接层的参数开销 1 4 softmax运算 1 5 小批量样本的矢量化 1 6 损失函数 1 6 1 对数似然 1 6 2 softmax及其导数 1 6 3 交
算法导论学习笔记第七章快速排序

快排最坏时间复杂度为 n 但它的平均性能很好通常是实际排序应用中最好的选择它的期望时间复杂度为 nlgn 且 nlgn 中隐含的常数因子非常小且它还能进行原址排序快排也使用了分治思想 1 分解数组被划分为两个子数组使得一个子数组
服务器如何开多个虚拟机,服务器运行多个虚拟机

服务器运行多个虚拟机内容精选换一换通过内网连接云手机实例时需要在租户VPC中创建一台弹性云服务器作为连接云手机的跳板机器若创建云手机服务器时未使用自定义网络还需在云手机租户的VPC和服务器所在VPC之间建立对等连接如图1所示
SpringBoot集成Netty时在Handler类中注入service和dao为null

最近在做一个服务器接收客户端消息之前一直都只接触web开发第一次接触服务器开发接触到Netty 但在Netty的Handler类里注入为null public class HttpRequestHandler extends Simp
【vue3练习 -12】vue3使用readonly(),shallowReadonly()

作用把一个响应式可以是ref定义的也可以是reactive定义的的数据变成只读的不可以修改使用场景假如你的组件有个数据但是你不希望在使用的时候修改他就可以把他变成只读的用法示例 import readonly shallo
SOLO算法解读

论文 SOLO Segmenting Objects by Locations 论文链接 https arxiv org abs 1912 04488 代码链接 GitHub WXinlong SOLO SOLO and SOLOv2 fo

热门标签