粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition

2023-05-16

相比于直接对图像进行分类，本文更关注特征提取部分，通过令提取的不同类特征在超球面上尽可能远离，让属于同一类的特征尽可能靠近，来提高模型面对样本不平衡时的分类性能。

这是本文的方法和效果示意图。第一行的KCL是之前的方法，TSC为本文方法。之前的方法在面对极端的样本不平衡时，训练图像多的类会挤占训练图像少的类，让小样本的类之间的特征混在一起，导致分类准确率下降，而本文方法面对极端不平衡时依然可以保持不同类的中心尽可能远离。

上图是流程示意图，模型主要分为两步，第一步，根据类的数量，在超球体上确定多个锚点，锚点数量等于类别数，每个锚点要尽可能远离其他锚点。

作者原本想让每个锚点的分布达到最优，但发现这是个NP问题，于是退而求其次，通过最小化下面这个公式达到近似最优的结果

可以看到，公式基本就是计算每个类和其他类的相似度，log和再求和。之所以两个向量点积就能求相似度，个人理解是如果每一位数字相同时，就是多个数的平方和，即点积结果是a^2+b^2+...

如果数字不同，就可以看作是原来的数字加了个数减了个数相乘，即可以看作是(a+x)(a-x)+(b+y)(b-y)，结果当然会变小。虽然在极端情况下，a^2小于(b+x)(b-x)是有可能的，如a=3而b=100，x=1。但本文锚点位于超球体上，且是多个点之间互相计算，所以不用担心最小化这个函数会导致某对点从相隔甚远变得十分靠近。

第二步，得到几个中心后，就要将不同的类分配给不同的中心，如果是简单的随机分配，语义特征相似的类可能会分得特别开，例如猫和狗语义特征相似，但分得的锚点却可能位于超球体两端，这样让模型更加迷茫，不知道如何提取特征。

于是作者在每一轮训练结束后，即每张训练集图片喂给模型完毕后，计算每个类的中心，通过匈牙利算法，将类与锚点进行配对。

分配完毕后，计算下面的损失函数，然后指导模型更新参数。

其中，N为一个batch的大小，V为该batch全部图像，vi为图像xi提取出来的特征， $\tilde{V}_{i}$ 是排除了vi后的其他所有图像， $\tilde{V_{i,k}^{+}}$ 是除了vi之外其余的与vi为同一类的图像集合，U是所有锚点t的集合，而ci则是vi分得的锚点。

按照前面的理论，两个向量点积越大，就可近乎地看作相似度越高。于是前半段是让同一类的特征尽可能靠近，而后一段则是让每个点尽可能靠近自己分得的锚点，远离其他锚点和其他类的特征。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition 的相关文章

No plugin found for prefix ‘tomcat7’ in the current project and in the plugin groups

idea中开发javaweb应用 xff0c 使用mvn tomcat7 run命令运行应用时 xff0c 需要配置tomcat的maven插件在没有配置的情况下会出现下面的错误提示 ERROR No plugin found for p
在Vue中获取v-for的index值

lt el submenu index 61 34 item id 43 39 39 34 v for 61 34 item index in menuList 34 key 61 34 item id 34 gt lt template
Deep Meta Learning for Real-Time Target-Aware Visual Tracking 论文阅读

这篇文章是韩国的一个组做的一直没中直到19年中了ICCV xff0c 据说是第一篇将元学习引入目标跟踪的文章 xff0c 用的架构是siamese网络的架构 xff0c 但是在模型在线更新的时候使用了meta learning的思想 M
Unable to allocate 130176KB bitmaps for parallel garbage collection for the requested 4165632KB heap

我运行springboot中的 Springboot082ShiroApplicationTests时 xff0c 显示的是内存不足 xff0c 但是实际上我也没开多少应用 xff0c 而且之前一直没问题 xff0c 后来发现是因为我已经开
将sql文件导入数据库时，报错Data truncated for column

解决办法打开my span class token operator span ini配置文件将sql model中的 span class token constant STRICT TRANS TABLES span 去掉
UCF101和HMDB51数据集的处理 for Human Action Recognition

数据集简介 xff1a 一数据集获取 xff1a 1 UCF 101 http crcv ucf edu data UCF101 UCF101 rar 此外 xff0c 该数据集由于超过4G了无法上传百度云 xff0c 所以还在自己移动硬
TypeError: Expected cv::UMat for argument ‘img‘

研究Detectron2中的在线数据增强的源码并显示数据增强后的图像时 xff0c 遇到 TypeError Expected cv UMat for argument 39 img 的问题显然 xff0c 问题要求是输入一个uint8
VTK6.3.0 error: no override found for 'vtkPolyDataMapper'

1 开发环境计算机系统 Win7 Qt版本 5 4 0 Qt Creator版本 3 0 1 VTK版本 6 3 0 编译器 VS2013 2 解决方法1 根据参考资料 1 的说明 xff0c 在源程序中添加头文件 cpp view pl
解决：No converter for [xxxx] with preset Content-Type ‘text/plain；version=0.0.4；charset=utf-8‘

文章目录项目背景问题描述问题分析解决方案方案一 xff1a 修改Controller定义方案二 xff1a 修改Controller返回值方案三 xff1a 全局处理项目背景 Spring Boot 2 X 问题描述错误信息如下 xf
navicat for mysql自增_mysql，navicat怎么设置主键自增

Navicat是应用比较多的mysql的视图管理工具下面记录下Navicat如何设置主键自增的操作 1 找到需要操作的表右键找到设计表 2 找到对应的字段改为int型在下面会出现自动递增的勾选 xff0c 勾上即可注意 xff0c
RS雷达转Velodyne雷达数据Failed to find match for field ‘intensity‘

目录 xff1a 问题分析解决问题因为目前很多SLAM框架支持的激光雷达都是Velodyne型号的 xff0c 对于速腾RS雷达的使用者来说 xff0c 需要对数据进行转换 xff0c 其实现在速腾的雷达已经支持输出XYZI和XYZIR
Access denied for user ''@'localhost' (using password: YES)错误解决方法

远程登录被拒绝 xff0c 要改一个表数据的属性让他可以远程登录解决方法如下 xff0c 执行命令 xff1a mysql gt use mysql mysql gt select host user from user 查看结果是不是r
[AR论文阅读] Tracking Requirements for Augmented Reality

论文作者 xff1a RONALD AZUMA年份 xff1a 1993论文主题 xff1a 阐述AR系统对6DoF跟踪性能的技术要求要点 xff1a 三个核心要求 xff1a 高精度 xff0c 低延迟 xff0c 大范围跟踪精度指标
【STL十八】算法——不修改序列的操作（for_each、count、find、equal、search）

STL十八算法不修改序列的操作 xff08 for each count find equal search xff09 一简介二头文件三分类四不修改序列的操作1 for each2 count count if3 find f
MPLAB构建项目报错“recipe for target ‘.build-conf‘ failed”

recipe for target build conf failed 刚入门单片机 xff0c 在写程序时 xff0c 当时写完 xff0c build成功 xff0c 但是第二天过来 xff0c 改写了部分代码 xff0c 然后去bui
v-if和v-for的优先级

文章目录 vue2vue3 vue2 v for优先级比v if高v for与v if作用在不同标签时候 xff0c 是先进行判断 xff0c 再进行列表的渲染注意事项永远不要把 v if 和 v for 同时用在同一个元素上 xff0
[ 对比学习篇 ] 经典网络模型 —— Contrastive Learning

Author Horizon Max 编程技巧篇各种操作小结神经网络篇经典网络模型算法篇再忙也别忘了 LeetCode 对比学习篇经典网络模型 Contrastive Learning 01 InstDisc 结构框图详解效
Go语言学习15-基本流程控制

基本流程控制流程控制对比 Go 和 C 基本流程控制 1 代码块和作用域 2 if 语句 3 switch语句 3 1 表达式switch语句 3 2 类型switch语句 4 for 语句 4 1 for 子句 4 2 range 子句
Python 的 map、列表推导、循环效率比较

话不多说直接上代码 1 准备数据三个列表 import time x x1 x2 for i in range 1000000 x append i x1 append i x2 append i 2 开始表演 2 1 for循环 st
批处理学习教程（4）------for的用法

循环 for 1 如果批处理不具备批量处理的功能那么它就徒有虚名了而命令 for 在某种意义上彻底体现出了批处理的强大快捷省事批量的作用在看过 for 后可以归纳出 for 大致可以分三种常用的类型或者叫使用方法从针对的循环目标

随机推荐

openstack介绍及原理

openstack介绍及原理文章目录什么是openstack 云计算模式OpenStack 中有哪些项目 xff1f Openstack创建实例的流程总图openstack项目搭建 xff1a 什么是openstack OpenStac
生产者消费者模型（多-多模型/面向对象思想实现）

本篇文章将用c 43 43 的面向对象思想 xff0c 实现生产者消费者模型的代码编写个人感悟 xff1a 1 多生产者多消费者模型的共享竞争关系 xff1a 对缓冲区的共享和竞争 xff1a 生产者和消费者都需要对共享缓冲区进行操作 x
openstack报错排查

openstack各个组件 openstack要保证各个组件能正常启动否则创建实例等会报错在启动openstack的时候要查看各个服务是否正常启动了 xff0c 如果有部分服务没有启动 xff0c 则项目不能正常运行 root 64
vim如何批量注释

1 ctrl 43 v 进入 2 按箭头选中要注释的首行 3 按下大写 i 进入插入模式 4输入按esc 就可以看到如下内容
vim中的替换

Vim可以在尾行模式下使用 substitute命令将指定的字符串替换成其他目标字符串通常我们可以使用该命令的缩写格式 s进行来进行vim字符串替换操作一 Vim替换字符串命令的语法 Vim替换字符串命令的基本语法是 range s 目
docker删除无用的镜像等操作

提供 prune命令 xff0c 用于移除不使用的镜像容器卷网络 Prune images docker image prune移除没有标签并且没有被容器引用的镜像 xff0c 这种镜像称为 dangling 摇晃的镜像示例1 x
Python之requests模块-session

http协议本身是无状态的 xff0c 为了让请求之间保持状态 xff0c 有了session和cookie机制 requests也提供了相应的方法去操纵它们 requests中的session对象能够让我们跨http请求保持某些参数 xf
git 对比两个分支差异

1 显示出branch1和branch2中差异的部分 git diff branch1 branch2 stat 2 显示指定文件的详细差异 git diff branch1 branch2 具体文件路径 3 显示出所有有差异的文件的详细差
操作系统中cpu如何工作

扩充小知识 xff1a 这些硬件设备在一条总线上链接 xff0c 他们通过这条线进行数据交互 xff0c 里面的带头大哥就是CPU xff0c 拥有最高指挥权那么它是如何工作的呢 xff1f A 取指单元 xff08 从内存中取得指令 x
dev/mapper的解释

二 dev mapper目录的解释为了方便叙述 xff0c 假设一台服务器有三块硬盘分别为a xff0c b xff0c c xff0c 每块硬盘的容量为1T 在安装Linux的时候 xff0c 先根据系统及自身的需要建立基本的分区 xf
Centos安装python39(其他版本也是一样的流程)

Centos安装python39 其他版本也是一样的流程 centos安装python39 其他版本也是一样的流程 1 下载python39 可以去官网下载 xff0c 也可以去华为云下载华为云 xff1a Index of python
centos 中如何启动两个rabbitmq 服务

启动两个rabbitmq 服务 sudo RABBITMQ NODE PORT 61 5672 RABBITMQ DIST PORT 61 15672 RABBITMQ SERVER START ARGS 61 34 rabbitmq ma
【码农本色】用数据解读我的2014

转眼2014就过去了 xff0c 不禁感叹又老了一岁的同时 xff0c 却发现已经快研究生毕业了 xff0c 趁着这个活动简单总结下2014 1 实习篇 2014年一月份拿到了人生第一个实习offer xff0c 在sony这样的大公司做a
出现Permission denied (publickey)的解决方法

ssh root 64 10 240 1 161 报错 1 发现问题在Linux终端使用ssh root 64 server ip来连接到远程服务器时 xff0c 出现Permission denied publickey 提示 2 分析
23年4月开发语言最新排行榜公布

随着时代的发展 xff0c 编程语言也在不断演化和发展 xff0c 每一种编程语言都有着其独特的特性和适用场景在这篇博客中 xff0c 我们将来探讨一下各大编程语言的排行榜 xff0c 以及它们各自的优缺点和应用场景下面是最新的 Tio
CommandNotFoundError: No command ‘conda activate‘

前言 xff0c 在windows下使用coda 虚拟环境时 xff0c 在激活环境 conda activate env name 时 xff0c 报错找不到 conda activate 的命令浪费了好久的时间 xff0c 找到了合适
Spring、SpringMVC常用注解总结

一 Spring常用注解 64 Component xff1a 标注一个普通的Spring Bean类 64 Controller xff1a 标注一个控制器组件类 64 Service xff1a 标注一个业务层组件类 64 Reposi
关于Ubuntu fix-broken 的使用

执行命令 xff1a sudo apt fix broken install sudo apt get update sudo apt get upgrade 运行后可以解决由于依赖包缺失或错误引起的无法通过apt get来安装应用
java看书规划

Java编程思想大话设计模式重构改善既有代码的设计 effective java 深入理解Java虚拟机 Java并发编程实战深入理解计算机系统 xff0c tcp ip详解卷一二三 xff0c 数据结构与算法 xff08 三
粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition

相比于直接对图像进行分类 xff0c 本文更关注特征提取部分 xff0c 通过令提取的不同类特征在超球面上尽可能远离 xff0c 让属于同一类的特征尽可能靠近 xff0c 来提高模型面对样本不平衡时的分类性能这是本文的方法和效果示意图第

粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition

粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition 的相关文章

随机推荐

热门标签