Kaiming He论文阅读笔记三——Simple Siamese Representation Learning

2023-05-16

Kaiming He大神在2021年发表的Exploring Simple Siamese Representation Learning，截至目前已经有963的引用，今天我们就一起来阅读一下这篇自监督学习论文。

Siamese网络(wiki介绍)是应用于两个或多个输入的权重共享神经网络，它使用相同的权重，同时在两个不同的输入向量上协同工作以计算可比较的输出向量。通常其中一个输出向量是预先计算的，从而形成一个基线，与另一个输出向量进行比较。它们是比较(包括但不限于“对比”)实体的天然工具。

如MoCo就是一种Siamese网络中，MoCo维护一个负样本队列，并将其中一个分支变为动量编码器，以提高队列的一致性。SimCLR直接使用当前批中共存的负样品，需要较大的批大小才能正常工作。SimSiam直接共享两个分支之间的权值，所以它也可以被认为是“没有负对的SimCLR”。

SimSiam架构如下，它的行为类似于交替优化每个集合。一个图像的两个增强视图由同一个encoder f(backbone加projection MLP处理。然后，在一侧应用predictor MLP h，在另一侧应用停止梯度操作。预测MLP头h对一个视图的输出进行转换，并与另一个视图进行匹配，该模型使两边的余弦相似度最大化。
在这里插入图片描述
设输出 p 1 = h ( f ( x 1 ) ) , z 2 = h ( f ( x 2 ) ) p_1=h(f(x_1)),z_2=h(f(x_2)) p1=h(f(x1)),z2=h(f(x2))，我们最小化余弦相似度的负值：
在这里插入图片描述
Siamese的一个重要工作是取消梯度更新(stopgrad)，我们定义对称损失为

伪代码如下：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Kaiming He论文阅读笔记三——Simple Siamese Representation Learning 的相关文章

Kaiming He论文阅读笔记三——Simple Siamese Representation Learning

Kaiming He大神在2021年发表的Exploring Simple Siamese Representation Learning xff0c 截至目前已经有963的引用 xff0c 今天我们就一起来阅读一下这篇自监督学习论文 Si
关于Few-Shot Learning & Meta-Learning 的一些 Q&A

最近在研究FSL xff0c 查资料找到自己存在的一些疑问 xff0c 若有误欢迎大家交流指正 1 什么是Few shot Learning和Meta learning xff1f Few shot learning是一种机器学习的范式 x
【CAM】Learning Deep Features for Discriminative Localization

论文链接 github Abstract 1 Introduction CNN能保留位置信息 xff0c 但经过用于分类的全连接神经网络时会丢失位置信息最近的NIN和GoogLeNet使用全卷积网络避免使用全连接层 xff0c 来减少参
[翻译]Learning Deep Features for Discriminative Localization

英文原文请点这里摘要在这项工作中 xff0c 我们重新审视了 Network in network 中提出的全局平均池化层 xff08 global average pooling xff09 xff0c 并阐明了它是如何通过图片标签
调参之learning rate

The learning rate is perhaps the most important hyperparameter If you have time to tune only one hyperparameter tune the
2017论文阅读：Learning a Rotation Invariant Detector with Rotatable Bounding Box

文章代码已开源文章目录文章贡献1 Rotatable bounding box2 Rotation invariant detection2 1 模型结构总览2 2 模型训练2 3 实现的细节 3 实验 amp 结果文章贡献提出了一
Model-Agnostic Meta-Learning （MAML）模型介绍及算法详解

整理自 xff1a Frank Tian 回答首先 xff0c 我们先从Meta Learning的概念说起原始的机器学习的流程被认为是下面这这样的 xff1a 也就是我们根据我们先验知识设计网络架构和参数初始化方法 xff0c 从Tr
Multi-Center Federated Learning

Multi Center Federated Learning Motivation 现有的联合学习方法通常采用单个全局模型来通过汇总其梯度来捕获所有用户的共享知识 xff0c 而不管其数据分布之间的差异如何但是 xff0c 由于用户行为
English learning method ---我谈音标学习

最近在想这样一个问题 xff1a 每个地方都有自己的方言 xff0c 有些方言我们完全听不懂 xff0c 但是他们当地人却可以交流的很好 xff1b 而非本地人说方言 xff0c 就要模仿他们的腔调 xff0c 模仿的多了说出来的味也就像了
Deep Learning 最优化方法之RMSProp

本文是Deep Learning 之最优化方法系列文章的RMSProp方法主要参考Deep Learning 一书整个优化系列文章列表 xff1a Deep Learning 之最优化方法 Deep Learning 最优化方法之S
An Introduction on Deep Learning for the Physical Layer

An Introduction on Deep Learning for the Physical Layer 代码实现 xff1a https github com shengjian3476077 DLforPhy 一文章的主要工作
【simple-cache】我开发了一款只要一个注解就可以轻松实现缓存的框架

x1f436 背景 xff1a 我们在写web项目的时候 xff0c 当大量的请求进来会导致我们数据库压力过大 xff0c 所以我们需要加入缓存来减轻数据库的压力 xff0c 但是现在市面上的很多缓存框架配置太复杂 xff0c 所以该框架只
px4_simple_example和uorb机制

px4 simple app PX4 Autopilot src exampes px4 simple app xff0c 这个程序是用c语言调用orb API和poll机制订阅和发布通讯数据 xff0c 但是这个例子并不是既有接收又有发送
Panoptic-DeepLab: A Simple, Strong, and Fast Baseline for Bottom-Up Panoptic Seg论文复现

Panoptic DeepLab A Simple Strong and Fast Baseline for Bottom Up Panoptic Segmentation论文复现一下载二环境配置 2 1 按照下方 how to u
X-Pack的machine learning

如何使用X Pack的machine learning 最近在使用X Pack中的机器学习功能 xff0c 主要的就是利用非监督的时间序列模型 xff0c 用来检测流量的变化 xff0c 关于X Pack这块的文章好像可以参考的比较少 xf
神经网络学习小记录53——TF2搭建孪生神经网络（Siamese network）比较图片相似性

神经网络学习小记录53 TF2搭建孪生神经网络 Siamese network 比较图片相似性学习前言什么是孪生神经网络代码下载孪生神经网络的实现思路一预测部分 1 主干网络介绍 2 比较网络二训练部分 1 数据集的格式 2
web2py数据库中的表示格式

db define table person Field name format name s 这个格式在这里有什么作用 The format参数用于确定如何显示引用 person 表的其他表中的字段例如如果您定义 db define
Python 正确使用 __str__ 和 __repr__

我当前的项目需要大量使用位字段我找到了一个简单实用的位字段类的配方但它缺少一些我需要的功能所以我决定扩展它我刚刚要实施 str and repr 我想确保我遵守惯例 str 应该是非正式和简洁的所以我让它返回位字段的十进制值即st
格式错误的字符串 ValueError ast.literal_eval() 与元组的字符串表示形式

我正在尝试从文件中读取元组的字符串表示形式并将该元组添加到列表中这是相关代码 raw data userfile read split n for a in raw data print a btc history append ast
有没有 Android 视图生命周期的图形表示（状态图）？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我们都知道AndroidActivity的生命周期 http developer android com

随机推荐

项目实战-外卖自提柜 2. CubeMX + FreeRTOS入门

项目实战外卖自提柜 1 项目介绍协议制定项目实战外卖自提柜 2 CubeMX 43 FreeRTOS入门项目实战外卖自提柜 3 FreeRTOS主要API的应用项目实战外卖自提柜 4 FreeRTOS 堆栈分配调试技巧项
项目实战-外卖自提柜 3. FreeRTOS主要API的应用

项目实战外卖自提柜 1 项目介绍协议制定项目实战外卖自提柜 2 CubeMX 43 FreeRTOS入门项目实战外卖自提柜 3 FreeRTOS主要API的应用项目实战外卖自提柜 4 FreeRTOS 堆栈分配调试技巧项
项目实战-外卖自提柜 4. FreeRTOS 堆栈分配、调试技巧

项目实战外卖自提柜 1 项目介绍协议制定项目实战外卖自提柜 2 CubeMX 43 FreeRTOS入门项目实战外卖自提柜 3 FreeRTOS主要API的应用项目实战外卖自提柜 4 FreeRTOS 堆栈分配调试技巧项
项目实战-外卖自提柜 5. ESP8266 01S配置与掉线处理

项目实战外卖自提柜 1 项目介绍协议制定项目实战外卖自提柜 2 CubeMX 43 FreeRTOS入门项目实战外卖自提柜 3 FreeRTOS主要API的应用项目实战外卖自提柜 4 FreeRTOS 堆栈分配调试技巧项
项目实战-外卖自提柜 6. 硬件工作与测试（原理图、PCB绘制、测试视频）

项目实战外卖自提柜 1 项目介绍协议制定项目实战外卖自提柜 2 CubeMX 43 FreeRTOS入门项目实战外卖自提柜 3 FreeRTOS主要API的应用项目实战外卖自提柜 4 FreeRTOS 堆栈分配调试技巧项
Anaconda中报CondaSSLError错误的解决方法

windows10上 xff0c 在使用Anaconda配置instant ngp环境时 xff0c 依次执行如下命令 xff0c 当执行第4条命令安装ffmpeg时 xff0c 报了如下错误 xff1a CondaSSLError Ope
【学习笔记】STM32固件库内部结构及功能简介

本文为 150集野火F103霸道指南者视频教程入门篇的学习笔记原视频 xff1a P16 初识STM32固件库我们认为固件库应该是什么样子的 1 汇编编写的启动文件 startup stm32f10x hd s 设置堆栈指针设置
香港中文大学计算机系直博面试经验

2021年7月12日 xff0c 我拿到了香港中文大学的offer xff0c 开个帖子记录一下面试题目 xff0c 方便学弟学妹参考一导师面试 2021年5月 xff0c 我通过发邮件联系了导师 xff0c 附上了我的个人简历 xff
基于检测代码库detectron2的蒸馏应用

基于检测代码库detectron2和蒸馏代码库RepDistiller xff0c 完成将蒸馏方法应用在目标检测的代码库 xff0c 完整代码已开源 1 参数添加在config defaults py里面添加蒸馏参数的默认值 xff0c
Transformer论文解读一（Transformer）

最近Transformer在CV领域很火 xff0c Transformer是2017年Google发表的Attention Is All You Need xff0c 主要是针对自然语言处理领域提出的本系列文章介绍Transformer
使用python的turtle库函数画圣诞树详细教程

今天改bug改到自闭 xff0c 花了一晚上时间最后发现是一个小参数导致的 xff0c 唉 xff01 想到最近画圣诞树不是很火嘛 xff0c 就放松一下 xff0c 出个画圣诞树的教程吧首先我们的目标是这样子的 xff1a 那么他有什么
GAN综述及其在图像生成领域的应用（含原理、代码详解）

本文将持续更新目录 1 基本GAN1 1 GAN xff08 2014 xff09 1 2 CGAN xff08 2015 xff09 1 3 DCGAN xff08 2015 xff09 1 4 VAE GAN xff08 2016 x
Out of Distribution(OoD)检测相关方法综述

1 Softmax based 方法这类方法利用预训练模型输出的最大 softmax 概率进行统计分析 xff0c 统计发现 OOD 样本和 ID 样本 softmax 概率的分布情况 xff0c 试图将二者的分布差距加大 xff0c 然
什么是自注意力机制（Self-attention）

文章目录 1 Self attention的基本概念1 1 Self attention的单个输出1 2 Self attention的并行计算1 3 Multi head Self attention1 4 Positional Enco
Kaiming He 论文阅读笔记一——Masked Autoencoders

2022年Kaiming大神又发表了三篇新paper xff0c 今天我们阅读其中的Masked Autoencoders Are Scalable Vision Learners以及Masked Autoencoders As Spati
Kaiming He论文阅读笔记二——Plain Vision Transformer Backbones for Object Detection

Kaiming在2022年发表了一篇Exploring Plain Vision Transformer Backbones for Object Detection 文章的主要目的是追求一种包含较少诱导偏差的主干原因在于 xff1a 允
通过Python将mp4视频文件转为动画gif

通过Python将mp4视频文件转换为动画gif有几种方法 xff0c 如imageio moviepy Pillow 这里使用imageio 43 opencv进行转换通过conda创建虚拟环境Python Test xff0c 将终端
关系型数据库种类

常见主流数据库分类 xff1a DB2 Oracle Informix Sybase SQL Server PostgreSQL mySQL Access数据库 FoxPro数据库 Teradata 1 IBM 的DB2 DB2是IBM著名
非替换元素和替换元素

元素是文档结构的基础 xff0c 在css里面 xff0c 每个元素生成了包含内容的框 xff08 box xff09 大家都叫盒子但是不同的元素显示方式是不同的 xff0c 有占据一整行的 xff0c 有水平一个挨着一个的比如 xf
Kaiming He论文阅读笔记三——Simple Siamese Representation Learning

Kaiming He大神在2021年发表的Exploring Simple Siamese Representation Learning xff0c 截至目前已经有963的引用 xff0c 今天我们就一起来阅读一下这篇自监督学习论文 Si

Kaiming He论文阅读笔记三——Simple Siamese Representation Learning

Kaiming He论文阅读笔记三——Simple Siamese Representation Learning 的相关文章

随机推荐

热门标签