有监督对比loss计算

2023-11-13

https://blog.csdn.net/wf19971210/article/details/116715880

关于对比损失

无监督对比损失，通常视数据增强后的图像与原图像互为正例。而对于有监督对比损失来说，可以将同一batch中标签相同的视为正例，与它不同标签的视为负例。对比学习能够使得同类更近，不同类更远。有监督对比损失公式如下。

有监督对比损失数学公式

Pytorch实现有监督对比损失

话不多说，直接看代码。为了更好的说明有监督对比损失的整个实现过程，以下代码没有经过系统整理，从一个例子，一步一步地计算出损失。若是理解了每一步，那系统整理应该没什么问题。

1.通过cos计算相似度

import torch
import torch.nn.functional as F
T = 0.5  #温度参数T
label = torch.tensor([1,0,1,0,1])
n = label.shape[0]  # batch
#假设我们的输入是5 * 3  5是batch，3是句向量
representations = torch.tensor([[1, 2, 3],[1.2, 2.2, 3.3],
                                [1.3, 2.3, 4.3],[1.5, 2.6, 3.9],
                                [5.1, 2.1, 3.4]])
#这步得到它的相似度矩阵
similarity_matrix = F.cosine_similarity(representations.unsqueeze(1), representations.unsqueeze(0), dim=2)
#这步得到它的label矩阵，相同label的位置为1
similarity_matrix = torch.exp(similarity_matrix/T)
print('similarity_matrix is *****')
print(similarity_matrix)

结果

similarity_matrix is *****
tensor([[7.3891, 7.3851, 7.3241, 7.3777, 4.9964],
        [7.3851, 7.3891, 7.3172, 7.3872, 5.1341],
        [7.3241, 7.3172, 7.3891, 7.3079, 4.9291],
        [7.3777, 7.3872, 7.3079, 7.3891, 5.2278],
        [4.9964, 5.1341, 4.9291, 5.2278, 7.3891]])

2.创建各种mask

mask = torch.ones_like(similarity_matrix) * (label.expand(n, n).eq(label.expand(n, n).t())) - torch.eye(n, n )
#这步得到它的不同类的矩阵，不同类的位置为1
mask_no_sim = torch.ones_like(mask) - mask
#这步产生一个对角线全为0的，其他位置为1的矩阵
mask_dui_jiao_0 = torch.ones(n ,n) - torch.eye(n, n )
#这步给相似度矩阵求exp,并且除以温度参数T
print('mask is *****')
print(mask)

print('mask_no_sim is *****')
print(mask_no_sim)

print('mask_dui_jiao_0 is *****')
print(mask_dui_jiao_0)

结果为

mask is *****
tensor([[0., 0., 1., 0., 1.],
        [0., 0., 0., 1., 0.],
        [1., 0., 0., 0., 1.],
        [0., 1., 0., 0., 0.],
        [1., 0., 1., 0., 0.]])
mask_no_sim is *****
tensor([[1., 1., 0., 1., 0.],
        [1., 1., 1., 0., 1.],
        [0., 1., 1., 1., 0.],
        [1., 0., 1., 1., 1.],
        [0., 1., 0., 1., 1.]])
mask_dui_jiao_0 is *****
tensor([[0., 1., 1., 1., 1.],
        [1., 0., 1., 1., 1.],
        [1., 1., 0., 1., 1.],
        [1., 1., 1., 0., 1.],
        [1., 1., 1., 1., 0.]])

3.相应创建各种矩阵

#这步将相似度矩阵的对角线上的值全置0，因为对比损失不需要自己与自己的相似度
similarity_matrix = similarity_matrix*mask_dui_jiao_0
print('similarity_matrix is *******')
print(similarity_matrix)

#这步产生了相同类别的相似度矩阵，标签相同的位置保存它们的相似度，其他位置都是0，对角线上也为0
sim = mask*similarity_matrix
print('sim is ')
print(sim)

#用原先的对角线为0的相似度矩阵减去相同类别的相似度矩阵就是不同类别的相似度矩阵
no_sim = similarity_matrix - sim
print('no_sim is ')
print(no_sim)
#把不同类别的相似度矩阵按行求和，得到的是对比损失的分母(还差一个与分子相同的那个相似度，后面会加上)
no_sim_sum = torch.sum(no_sim , dim=1)

结果为

similarity_matrix is *******
tensor([[0.0000, 7.3851, 7.3241, 7.3777, 4.9964],
        [7.3851, 0.0000, 7.3172, 7.3872, 5.1341],
        [7.3241, 7.3172, 0.0000, 7.3079, 4.9291],
        [7.3777, 7.3872, 7.3079, 0.0000, 5.2278],
        [4.9964, 5.1341, 4.9291, 5.2278, 0.0000]])
sim is 
tensor([[0.0000, 0.0000, 7.3241, 0.0000, 4.9964],
        [0.0000, 0.0000, 0.0000, 7.3872, 0.0000],
        [7.3241, 0.0000, 0.0000, 0.0000, 4.9291],
        [0.0000, 7.3872, 0.0000, 0.0000, 0.0000],
        [4.9964, 0.0000, 4.9291, 0.0000, 0.0000]])
no_sim is 
tensor([[0.0000, 7.3851, 0.0000, 7.3777, 0.0000],
        [7.3851, 0.0000, 7.3172, 0.0000, 5.1341],
        [0.0000, 7.3172, 0.0000, 7.3079, 0.0000],
        [7.3777, 0.0000, 7.3079, 0.0000, 5.2278],
        [0.0000, 5.1341, 0.0000, 5.2278, 0.0000]])

4.计算分母的矩阵

'''
将上面的矩阵扩展一下，再转置，加到sim（也就是相同标签的矩阵上），然后再把sim矩阵与sim_num矩阵做除法。
至于为什么这么做，就是因为对比损失的分母存在一个同类别的相似度，就是分子的数据。做了除法之后，就能得到
每个标签相同的相似度与它不同标签的相似度的值，它们在一个矩阵（loss矩阵）中。
'''
no_sim_sum_expend = no_sim_sum.repeat(n, 1).T
print('no_sim_sum_expend is ')
print(no_sim_sum_expend)
sim_sum  = sim + no_sim_sum_expend

结果为

no_sim_sum_expend is 
tensor([[14.7628, 14.7628, 14.7628, 14.7628, 14.7628],
        [19.8363, 19.8363, 19.8363, 19.8363, 19.8363],
        [14.6251, 14.6251, 14.6251, 14.6251, 14.6251],
        [19.9134, 19.9134, 19.9134, 19.9134, 19.9134],
        [10.3618, 10.3618, 10.3618, 10.3618, 10.3618]])

5.计算对比loss

loss = torch.div(sim , sim_sum)
    '''
    由于loss矩阵中，存在0数值，那么在求-log的时候会出错。这时候，我们就将loss矩阵里面为0的地方
    全部加上1，然后再去求loss矩阵的值，那么-log1 = 0 ，就是我们想要的。
    '''
    loss = mask_no_sim + loss + torch.eye(n, n )
    #接下来就是算一个批次中的loss了
    loss = -torch.log(loss)  #求-log
    #loss = torch.sum(torch.sum(loss, dim=1) )/(2*n)  #将所有数据都加起来除以2n
    #print(loss)  #0.9821
    #最后一步也可以写为---建议用这个， (len(torch.nonzero(loss)))表示一个批次中样本对个数的一半
    loss = torch.sum(torch.sum(loss, dim=1)) / (len(torch.nonzero(loss)))

6.完整的计算

def sup_constrive(representations, label,T):
    n = label.shape[0]
    similarity_matrix = F.cosine_similarity(representations.unsqueeze(1), representations.unsqueeze(0), dim=2)
    #这步得到它的label矩阵，相同label的位置为1
    mask = torch.ones_like(similarity_matrix) * (label.expand(n, n).eq(label.expand(n, n).t())) - torch.eye(n, n)
    
    #这步得到它的不同类的矩阵，不同类的位置为1
    mask_no_sim = torch.ones_like(mask) - mask
    #这步产生一个对角线全为0的，其他位置为1的矩阵
    mask_dui_jiao_0 = torch.ones(n ,n) - torch.eye(n, n )
    #这步给相似度矩阵求exp,并且除以温度参数T
    similarity_matrix = torch.exp(similarity_matrix/T)
    #这步将相似度矩阵的对角线上的值全置0，因为对比损失不需要自己与自己的相似度
    similarity_matrix = similarity_matrix*mask_dui_jiao_0
    #这步产生了相同类别的相似度矩阵，标签相同的位置保存它们的相似度，其他位置都是0，对角线上也为0
    sim = mask*similarity_matrix
    #用原先的对角线为0的相似度矩阵减去相同类别的相似度矩阵就是不同类别的相似度矩阵
    no_sim = similarity_matrix - sim
    #把不同类别的相似度矩阵按行求和，得到的是对比损失的分母(还差一个与分子相同的那个相似度，后面会加上)
    no_sim_sum = torch.sum(no_sim , dim=1)
    '''
    将上面的矩阵扩展一下，再转置，加到sim（也就是相同标签的矩阵上），然后再把sim矩阵与sim_num矩阵做除法。
    至于为什么这么做，就是因为对比损失的分母存在一个同类别的相似度，就是分子的数据。做了除法之后，就能得到
    每个标签相同的相似度与它不同标签的相似度的值，它们在一个矩阵（loss矩阵）中。
    '''
    no_sim_sum_expend = no_sim_sum.repeat(n, 1).T
    sim_sum  = sim + no_sim_sum_expend
    loss = torch.div(sim , sim_sum)
    '''
    由于loss矩阵中，存在0数值，那么在求-log的时候会出错。这时候，我们就将loss矩阵里面为0的地方
    全部加上1，然后再去求loss矩阵的值，那么-log1 = 0 ，就是我们想要的。
    '''
    loss = mask_no_sim + loss + torch.eye(n, n )
    #接下来就是算一个批次中的loss了
    loss = -torch.log(loss)  #求-log
    #loss = torch.sum(torch.sum(loss, dim=1) )/(2*n)  #将所有数据都加起来除以2n
    #print(loss)  #0.9821
    #最后一步也可以写为---建议用这个， (len(torch.nonzero(loss)))表示一个批次中样本对个数的一半
    loss = torch.sum(torch.sum(loss, dim=1)) / (len(torch.nonzero(loss)))
    
    return loss

x = torch.rand(8,64)
label = torch.tensor([0,2,3,2,1,1,3,1])
sup_constrive(x, label,T=0.1)

大致实现过程就是这样，如果有什么问题可以随时提出。或者有什么更好的实现方法，也欢迎共享。若你要使用该损失发文章，请引用：

“Chen, L., Wang, F., Yang, R. et al. Representation learning from noisy user-tagged data for sentiment classification. Int. J. Mach. Learn. & Cyber. (2022). https://doi.org/10.1007/s13042-022-01622-7”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

深度学习

机器学习

Powered by 金山文档

有监督对比loss计算的相关文章

错误：process_executor.py:702: ... 当一些作业被分配给执行器时，工作人员停止了。这可能是由于工作超时太短造成的

根据主题中的错误修复方法是什么环境 Python 3 9 或 3 10 Windows 10 x64 使用时出现错误joblib https joblib readthedocs io en latest 对于并行处理 result c
如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
此 TypeError 消息中提到的“代码对象”是什么？

在尝试使用Python时exec声明我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件但什么是代码对象如何创建一个创建代码对象的
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
Python Tkinter 模块不显示输出

我正在尝试学习 Python 并尝试使用 Python 中的 GUI 并遇到了这个 Tkinter 模块我的代码运行但运行时窗口没有出现我的代码如下 from Tkinter import to create a root windo
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
Python HMAC：类型错误：字符映射必须返回整数、None 或 unicode

我在使用 HMAC 时遇到了一个小问题运行这段代码时 signature hmac new key secret key msg string to sign digestmod sha1 我收到一个奇怪的错误 File usr loca
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
查找 Pandas DF 行中的最短日期并创建新列

我有一个包含多个日期的表有些日期将为 NaN 我需要找到最旧的日期所以一行可能有 DATE MODIFIED WITHDRAWN DATE SOLD DATE STATUS DATE 等因此对于每一行一个或多个字段中都会有一个日期
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v

随机推荐

python函数闭包

闭包函数的闭包与函数的嵌套类似它返回的不是一个值而是一个函数也就是说在函数内定义函数如加法函数 def sum a def add b return a b 内部函数add 引用了外部函数sum 的变量a return add 外
echarts自定义X轴、Y轴间距

echarts自定义X轴 Y轴间距 1 自定义间距 1 自定义间距最近做一个项目要求x y 轴间距自定义因为项目数据X轴为时间轴 Y轴为对数数据轴由于x轴的时间轴各段时间点返回密度不均匀所以一开始用interval 官网上spli
面试——软件测试

自我介绍 Web与app测试的区别 App与小程序测试的区别小程序的兼容性测试怎么测小程序测试需要分别测试Android和iOS吗还是怎么测试 Android小程序和iOS小程序的测试区别测试流程介绍一下项目公司有几个测试秒杀
maven 同时配置远程仓库和中央仓库的方法 mirroOf 标签意义

问题描述在公司内做maven项目开发时使用的都是公司内部搭建的私有远程仓库做项目开发所以导致setting文件的设置如下
华为OD机试 - 用连续自然数之和来表达整数（Java)

题目描述一个整数可以由连续的自然数之和来表示给定一个整数计算该整数有几种连续自然数之和的表达式且打印出每种表达式输入描述一个目标整数T 1 lt T lt 1000 输出描述该整数的所有表达式和表达式的个数如果有多种表达式
【vue3+elementplus】el-table的操作列使用子组件渲染按钮，按钮权限改变，父给子传值，子组件的dom不更新的解决方案

起初是因为我使用了这个回答里面的组件去渲染表格操作列需求点击某个按钮表格数据改变按钮的权限也随着该数据变化而变化问题表格行数据变了给子组件传的值也变了在watch中也监听了但是子组件的dom就是不更新原因重新获取表格数
单键控制单片机电源开关电路

原文地址 http www jichudianlu com archives 168 相关文章 1 问答单片机控制电源开关 https bbs elecfans com jishu 1698980 1 1 html 2 由MCU控制的开关
野火 RT1052 移植网卡功能(LAN8720A)

野火 RT1052 移植网卡功能 LAN8720A 开发环境 RT Thread v4 0 2 master SOC i MX RT1050 Board 野火 RT1052 目的在 RT Thread 系统上进行网络通讯背景描述 1 首
一维随机变量的常见分布、期望、方差及其性质与推导过程

文章目录必须知道的概率论知识一维变量离散随机变量 def 常见分布几何分布期望方差二项分布 b n p 期望方差泊松分布 P
小小圣诞树来了

作者小刘在这里每天分享云计算网络运维课堂笔记疫情之下你我素未谋面但你一定要平平安安一起努力共赴美好人生夕阳下是最美的绽放愿所有的美好再疫情结束后如约而至目录圣诞树一代码圣诞树一代码 import tu
postgres之jsonb属性的简单操作

jsonb的一些简单操作增删改查更新操作 attributes属性为jsonb类型方法定义 jsonb set target jsonb path text new value jsonb create missing boolean
MySql 笔记

数据结构 B TREE 二叉树顺序增长依次查询效率低红黑树数据多了深度越深效率自然低了 HASH 查询条件限制 B TREE 度 degree 节段的数据存储个数叶节点具有相同的深度叶节点的指针为空节点的数据key从左到右递
vue3 多种方法的锚点定位

在 Vue 3 中可以通过多种方式实现锚点定位包括使用原生的 JavaScript 方法和利用 Vue Router 提供的导航守卫等下面我会分别介绍这些方法 1 使用原生 JavaScript 方法在 Vue 3 中你可以使用
【Hadoop生态圈】7.离线OLAP引擎Hive入门教程

文章目录 1 简介 2 架构分析 3 环境准备 4 使用客户端工具操作hive 4 1 数据库操作 4 2 DDL操作 4 2 1 创建表 4 2 2 导入数据到hive表中 4 2 3 指定列和行分隔符创建表 4 2 4 数据类型 4 3
[已解决]jeesite生成页面的弹窗问题

jeesite生成的页面如需弹窗layer写法会有问题 actions push a href class btnList title i class fa fa check i a nbsp data confirm text 提示信息
ansible安装nginx

ansible安装nginx 定义一个ansible组把nginx tar包传到ansible主机 ansible 组名 m shell a yum y install pcre devel open devel gcc gcc c ng
Golang 单元测试详尽指引

文末有彩蛋作者 yukkizhang 腾讯 CSIG 专项技术测试工程师本篇文章站在测试的角度旨在给行业平台乃至其他团队的开发同学进行一定程度的单元测试指引让其能够快速的明确单元测试的方式方法本文主要从单元测试出发对Golan
IntelliJ IDEA 进行js Debug调试

idea的js调试目前看来不同给力一是玩转它需要安装谷歌插件支持二是貌似存在一些bug 一新建一个jsp并打上断点二调试 idea出现提示安装JetBrains IDE Support支持问题出现了点击其中连接却一直连不上
[其他]IDEA中Maven项目配置国内源

配置国内源主要解决了在maven项目中pom xml下载jar包失败或过慢的问题在IDEA中的设置分成两种设置当前项目与新创项目我们就需要两种都进行设置不然只有在当前项目配置了国内源新创项目的时候还是默认的状态由于下面两种设置
有监督对比loss计算

https blog csdn net wf19971210 article details 116715880 关于对比损失无监督对比损失通常视数据增强后的图像与原图像互为正例而对于有监督对比损失来说可以将同一batch中标签相同

有监督对比loss计算

有监督对比loss计算 的相关文章

随机推荐

热门标签

有监督对比loss计算的相关文章