度量学习（Metric learning）—— 基于分类损失函数（softmax、交叉熵、cosface、arcface）

2023-05-16

概述

首先，我们把loss归为两类：一类是本篇讲述的基于softmax的，一类是基于pair对的（如对比损失、三元损失等）。

基于pair对的，参考我的另一篇博客： https://blog.csdn.net/u012863603/article/details/119246720

基于softmax的改进主要有如下（有的loss拥有不同的名字）：softmax、center loss、range loss、Modified softmax、NormFace、large margin、 SphereFace （ angular softmax、A-Softmax ）、CosFace（AM Softmax两个团队撞车）、ArcFace（insightFace），其实基本上主要就是针对特征和分类的权值向量做归一化以及不同方式的引入large margin，他们的区别就是一个不断集成的过程，发展至今，常用的是softmax，人脸等特征模型好用的CosFace、ArcFace。因此，本文主要讲这两个（当这个系列几乎到达瓶颈时，过多的去记名词和对应的改动历史，个人感觉意义不大），其余的建议参考： https://zhuanlan.zhihu.com/p/34404607

softmax

在了解其他的模型的前提是先了解softmax，如上所述，其他均为softmax的改进，关于softmax这里需要解决几点常见的疑惑（之前我的疑惑和目前我的理解）：

*softmax是什么

*softmax 和损失函数的关系是什么（交叉熵损失为例）

*softmax 和分类器什么关系

1、softmax 是什么

首先，softmax 的作用是把一个序列，变成概率。假设输入的向量为是

，softmax的公式如下：

他能够保证：

1）所有的值都是 [0, 1] 之间的（因为概率必须是 [0, 1]）

2）所有的值加起来等于 1

然后我们看一下直接求概率的结果，如下公式（我们这里称之为hardmax）

Softmax 直接求解存在数值稳定的问题，因为要算指数，只要你的输入稍微大一点，比如，[1000, 2000, 3000], 分母上就是

，很明显，在计算上一定会溢出。其中一种解决方法就是使用 LogSoftmax （然后再求 exp ）。数值稳定性比 softmax 好一些。可以看到， LogSoftmax 省了一个指数计算，省了一个除法，数值上相对稳定一些。

2、 softmax 和损失函数的关系是什么（交叉熵损失为例）

cross entropy 是用来衡量两个概率分布之间的距离的，假设现在有一个样本集中两个概率分布p,q，其中p为真实分布，对于离散变量，H(p,q)称之为交叉熵，如下：

softmax能把一切转换成概率分布，如（0.1，0.2，0.3，0.4）；对于多分类而言，如果采用one-hot 编码，那么label便也成了一个概率分布，如（0，0，0，1），那么自然二者自然可以结合在一起使用。

而且通过上面讲到的softmax的述职稳定性的问题，似乎softmax和交叉熵就成了天设的一对，即使softmax数值计算更稳定，又节省了交叉熵的冗余log计算。并且在反向求导中也变得异常简洁（求导不是本文重点，不再赘述，因为现在的训练框架支持自动求导，不需要自己实现反传过程）。

3、softmax 和分类器什么关系

前面讲到softmax配合交叉熵构成了softmax 交叉熵损失，并且可以嵌入计算提高效率。以one hot编码，softmax的输入向量长度需要等同于类别的个数，因此需要一个全连接层将网络的特征向量映射为一个长度为类别数的向量，这个有区别于现代使用GAP（全局平均池化）替代多层FC的操作。如下图，可以认为从512维到10000维的映射全连接层为分类器，训练时接 softmax+交叉熵，测试时接softmax的到置信度（或者不接，直接取最大值）。

对应公式如下，m代表样本数，W代表最后一层全连接的参数，b代表偏置项，x代表特征向量：

我们来看用pytorch 怎么简单的实现（仅仅为了理解，pytorch本身已经实现了）

class Linear(nn.Module):
    def __init__(self):
        super(Linear, self).__init__()
        self.weight = nn.Parameter(torch.Tensor(2, 10))  # (input,output)
        nn.init.xavier_uniform_(self.weight)

    def forward(self, x, label):
        out = x.mm(self.weight) # 分类器的全连接层
        loss = F.cross_entropy(out, label) # 合并了softmax 和 交叉熵
        return out, loss

4、softmax存在的问题。

hard的max和soft的max到底有什么区别呢？看几个例子

如上表，相同输入向量情况，soft max比hard max更容易达到终极目标one-hot形式，或者说，softmax降低了训练难度，使得多分类问题更容易收敛。 Softmax鼓励真实目标类别输出比其他类别要大，但并不要求大很多（如下图左）。 Softmax Loss训练CNN，MNIST上10分类的2维特征映射可视化如下（从左到右：二维化的特征中分布类分界线，二维化的特征中特征的欧式距离实例，二维化的特征中特征归一化对应圆弧、最后一个FC的权重归一化对应该类的竖线）：

L2距离越小，向量相似度越高。而L2距离在二维和三维空间上可以直观的理解为两个点的距离，如上右图黄色虚线代表的就是两个红色箭头指示的两个空间点（二维向量也就是特征）的距离。而分类器的最后那个全连接层对应到每个类的权重也可以理解为空间中的点（对于上面的2为mnist，时间原因，我没有写源码画出具体位置，可以猜猜大概为每个类簇的中心位置），那么softmax的输入其实就是图上的特征乘以对应的权重（忽略偏置项，直观上也就是每个特征点和对应权重的距离）。那么说对于一个固定类别（训练和真实场景一样，如mnist都是10分类）的场景来说，使用softmax，训练的深度特征，会把整个超空间或者超球，按照分类个数进行划分，保证类别是 可分的 ，这一点对多分类任务如MNIST和ImageNet非常合适，因为测试类别必定在训练类别中（而且我自己认为，训练难度低会使得优点可能更多：收敛快、一定程度上更不容易过拟合）。

但是我们看到上面的场景的局限：测试类别必定在训练类别中。这一点非常不适合人脸识别任务，因为训练集的1W人数，相对测试集整个世界70亿人类来说，非常微不足道，而我们不可能拿到所有人的训练样本，更过分的是，一般我们还要求训练集和测试集不重叠。但是 Softmax并不要求类内紧凑和类间分离，并且无法用通过排除类中心（分类器最后一层对应类目的权重）外去度量，比如L2距离（余弦距离同理），可能同类的特征向量距离（黄色）比不同类的特征向量距离（绿色）更大。

所以需要改造Softmax，除了保证可分性外，还要做到特征向量类内尽可能紧凑，类间尽可能分离，以适用于度量的场景（测试类别不在训练类别中，如人脸）。对比损失和三元组损失需要精心地构建图像对和三元组，耗时并且构建的训练对的好坏直接影响识别性能。

二、CosFace、ArcFace

1、 CosFace

如上面的sortmax，cosface主要是将权重w和向量x进行了归一化，并乘以一个缩放系数，吸收（忽略）偏置项，增加margin。最后的损失如下：

重点就是s和m超参数的设置，虽然官方给了两个公式，但是本质上并不能很精确的指导这两个参数的设置，尤其在类别数远大于嵌入特征的维度的case（却是人脸等嘴常见的场景，官方的实验结果是s=64，m=0.35时最好），不同的m的影响。以下是不同m的影响。

具体实现比较简单，参考后面讲到的arcface。

2、 ArcFace

在CosFace的基础上，ArcFace，将惩罚项由cosine函数外移到了函数内，在训练稳定的同时更进一步地提升了人脸识别网络的辨别能力。公式如下：

具体实现上，在进行特征x和权重W标准化之后，它们之间的相乘等价于cosine距离cos ⁡ ( θ ) 。对其使用arc-cosine方程来计算特征和权重之间的角度θ ，然后添加一个额外的角度上的加的惩罚项m得到θ + m ，接着对其使用cosine函数得到cos ⁡ ( θ + m )，在之后进行re-scale（即按照CosFace中的方式得到s* cos ⁡ ( θ + m ) ），最后送入softmax损失函数中。

伪代码如下：

开源代码如下（pytorch）

class ArcMarginProduct(nn.Module):
    r"""Implement of large margin arc distance: :
        Args:
            in_features: size of each input sample
            out_features: size of each output sample
            s: norm of input feature
            m: margin
            cos(theta + m)
        """
    def __init__(self, in_features, out_features, s=30.0, m=0.50, easy_margin=False):
        super(ArcMarginProduct, self).__init__()
        self.in_features = in_features #输入特征维度，一般是512
        self.out_features = out_features #输出维度，是类别数目
        self.s = s #re-scale
        self.m = m #角度惩罚项
        self.weight = Parameter(torch.FloatTensor(out_features, in_features)) #权重矩阵
        nn.init.xavier_uniform_(self.weight) #权重矩阵初始化

        self.easy_margin = easy_margin
        self.cos_m = math.cos(m)
        self.sin_m = math.sin(m)
        self.th = math.cos(math.pi - m)
        self.mm = math.sin(math.pi - m) * m

    def forward(self, input, label):
        # --------------------------- cos(theta) & phi(theta) ---------------------------
        # 对应伪代码中的1、2、3行：输入x标准化、输入W标准化和它们之间进行FC层得到cos(theta)
        cosine = F.linear(F.normalize(input), F.normalize(self.weight))
        # 计算sin(theta)
        sine = torch.sqrt((1.0 - torch.pow(cosine, 2)).clamp(0, 1))
        # 对应伪代码中的5、6行：计算cos(theta+m) = cos(theta)cos(m) - sin(theta)sin(m)
        phi = cosine * self.cos_m - sine * self.sin_m
        if self.easy_margin:
            phi = torch.where(cosine > 0, phi, cosine)
        else:
            # 当cos(theta)>cos(pi-m)时，phi=cos(theta)-sin(pi-m)*m
            phi = torch.where(cosine > self.th, phi, cosine - self.mm)
        # --------------------------- convert label to one-hot ---------------------------
        # 对应伪代码中的7行：对label形式进行转换，假设batch为2、有3类的话，即将label从[1,2]转换成[[0,1,0],[0,0,1]]
        one_hot = torch.zeros(cosine.size(), device='cuda')
        one_hot.scatter_(1, label.view(-1, 1).long(), 1)
        # 对应伪代码中的8行：计算公式(6)
        # -------------torch.where(out_i = {x_i if condition_i else y_i) -------------
        output = (one_hot * phi) + ((1.0 - one_hot) * cosine)  # you can use torch.where if your torch.__version__ is 0.4
        # 对应伪代码中的9行，进行re-scale
        output *= self.s

        return output

对比softmax，arcface的特征和归一化分布如下（ ArcSoftmax需要更久的训练，这个收敛还不够充分. ）：

3、归一化、scale、margin的意义

从最新方法来看，权值W和特征f(或 x )归一化已经成为了标配，而且都给归一化特征乘以尺度因子s进行放大，目前主流都采用固定尺度因子s的方法，并且都加上了margin。

1）归一化的重要性

* 权值和特征归一化使得CNN更加集中在优化夹角上（可以使用余弦距离度量），得到的深度人脸特征更加分离（训练难度增大，原因见下面的成固定尺度因子）；

*特征向量都固定映射到半径为1的超球上，便于理解和优化；

* 特征归一化后，人脸识别计算特征向量相似度， L2距离和cos距离意义等价，计算量也相同，我们再也不用纠结到底用L2距离还会用cos距离。

2）乘固定尺度因子

*归一化会压缩特征表达的空间，造成无法收敛；

*乘尺度因子s。直观解释：相当于将超球的半径放大到s ，超球变大，特征表达的空间也更大（简单理解：半径越大球的表面积越大）。理论解释如下：仅特征归一化时，输出 {x1, x2, x3, x4} 等价于{s * cosθ, x2, x3, x4 } ，理想情况下，优后 θ 是0，x2=x3=x4都输出0，此时激活值为{1, 0, 0, 0}，指数函数非线性放大后输出为{e, 1, 1, 1}，归一化后置信度是{47.54%, 17.49%, 17.49%, 17.49%}，远远达不到收敛的要求，所以仅归一化是不能训练的。归一化后乘尺度因子s，这里以s=60为例，输出 {x1, x2, x3, x4} 等价于 {60* cosθ, x2, x3, x4 } ，理想情况下，优后 θ 是0，x2=x3=x4都输出0，此时激活值为{60, 0, 0, 0}，指数函数非线性放大后输出为{exp(60), 1, 1, 1}，归一化后置信度是{100%, 0%, 0%, 0%}，完全可以达到收敛要求。所以特征归一化必须乘尺度因子。

其实这就是著名的normface，对应的公式和可视化如下：

3）large margin

其实通过归一化+乘固定尺度因子，一方面可以使用余弦距离，一方面先增加难度（归一化），再缓和难度（乘尺度因子），其实特征已经比较好，如上图，实际性能也确实是加margin有提升，但是并没有很多。下面来说明原因。

为什么有提升。我们仍然以四分类，已经归一化且乘尺度因子的情况讨论（其余情况原理类似）：输出{x1, x2, x3, x4} 等价于{s * cosθ, x2, x3, x4} 。原始在输出x = {5, 1, 1, 1}时就接近收敛，训练停止，此时改用large margin softmax，第一列的 cosθ 强制变成cos(mθ) （即SphereFace）、 cosθ-m（即cosface）或 cos(θ+m)（即arcface），会使输出减小，其他列保持不变，此时输出可能变成了x = {4, 1, 1, 1}，网络又可以继续训练了，也就是增加训练难度，使训练得到的特征映射更好。不同loss的曲线对比，下图来自ArcFace，所有loss都是单调递减的。对比Softmax的 cosθ 曲线，乘性margin的SphereFace对应cos(mθ) 曲线下降最多，训练难度剧增，退火技术也难以收敛，反观加性margin的CosineFace和ArcFace下降较少，训练难度稍微增加，所以更容易收敛。

为什么提升不多（large margin 到底优化了什么）。 large margin优化的核心——夹角 θ 是权值W和特征f之间的夹角，也就是类内夹角约束，目标是让同一类的所有特征向量都拉向该类别的权值向量，并不是不同类别之间的夹角（所以切勿鲁莽的把训练时的m当做测试时的阈值）。因此充其量是又增加了训练难度。loss函数也完全没有涉及不同类别特征向量之间的夹角约束。具体来看 W * f = | W | * | f | * cos θ ，考虑W和f都是归一化的，训练目标从 cosθ 变成cos(4θ) 、 cosθ -0.35 或 cos(θ+0.5) ，都减小了输出激活值，如果要达到目标置信度100%，就需要优化出比Softmax更小的夹角 θ ，也就是说 large margin的优化目标是让权值向量W和特征向量f之间的夹角更小。

参考链接：

1、softmax cross-entropy关系; https://www.zhihu.com/question/294679135

2、人脸识别loss 上： https://zhuanlan.zhihu.com/p/34404607

3、人脸识别loss 下： https://zhuanlan.zhihu.com/p/34436551

4、 https://blog.csdn.net/qq_42732229/article/details/108349970

5、 https://zhuanlan.zhihu.com/p/35027284

6、 https://zhuanlan.zhihu.com/p/76541084

7、人脸识别函数特征可视化； https://cloud.tencent.com/developer/article/1750658

8、 https://zhuanlan.zhihu.com/p/35027284

9、 https://blog.csdn.net/AManFromEarth/article/details/107013578

10、 https://zhuanlan.zhihu.com/p/60747096

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

度量学习（Metric learning）—— 基于分类损失函数（softmax、交叉熵、cosface、arcface）的相关文章

图像处理之Haar特征

Haar like 特征是计算机视觉领域一种常用的特征描述算子也称为 Haar 特征 xff0c 这是因为 Haar like 是受到一维 haar 小波的启示而发明的所以称为类 Haar 特征 xff0c 后来又将 Haar like
任意大小汉字点阵字库（字模）的制作与生成单片机GUI/STemwin

1 首先介绍一下汉字点阵在汉字库中的地址计算公式 xff1a 汉字库种类繁多 xff0c 但都是按照区位的顺序排列的前一个字节为该汉字的区号 xff0c 后一个字节为该字的位号每一个区记录94个汉字 xff0c 位号则为该字在该区中
ubuntu下ifconfig找不到命令，packege ‘net-tools‘ has no installation candidate

PS xff1a 首先要将网络适配器设置为NAT模式刚用虚拟机安装完ubuntu后 xff0c 实用ifconfig提示找不到命令 xff1a 用sudo apt install net tools也提示错误 xff1a Package
caffe+opencv linux安装

有gpu http blog csdn net leijiezhang article details 53688157 仅CPU http blog csdn net u010402483 article details 51506616
Deep learning系列（十五）有监督和无监督训练

1 前言在学习深度学习的过程中 xff0c 主要参考了四份资料 xff1a 台湾大学的机器学习技法公开课 xff1b Andrew NG的深度学习教程 xff1b Li feifei的CNN教程 xff1b caffe官网的教程 xff1
c++ item

C 43 43 书单 xff1a 1 第一本基础好一些的 xff0c 可以看Stanley B Lippman的C 43 43 Primer xff0c 基础不太好的话 xff0c 可以看Stanley B Lippman的 Essent
链表基础知识总结

链表和数组作为算法中的两个基本数据结构 xff0c 在程序设计过程中经常用到尽管两种结构都可以用来存储一系列的数据 xff0c 但又各有各的特点数组的优势 xff0c 在于可以方便的遍历查找需要的数据在查询数组指定位置 xff08 如
关系型和非关系型数据库使用场景

面试 xff1a 你懂什么是分布式系统吗 xff1f Redis分布式锁都不会 xff1f gt gt gt 关系型数据库优点 SQL方便在多个表之间做非常复杂的数据查询事务支持安全性能高关系型数据库缺点不擅长大量数据的写入处理不擅
Dont't recreate the sequence! You would invalidate all independent objects and l

原文出处 xff1a https community oracle com message 4016489 4016489 Dont 39 t recreate the sequence You would invalidate all i
June 11th 模拟赛C T1 Sandcas Solution

空降题目处点我点我点我 Description FJ居住的城堡有N个城墙 1 lt 61 N lt 61 25 000 xff0c 编号为1到N xff0c 每个城墙的高度为M i 1 lt 61 M i lt 61 100 000 xf
树莓派3B安装64位系统

树莓派是一款微型计算机 xff0c 并且树莓派3B是目前树莓派家族中唯一一款采用64位处理器的产品但是树莓派官方提供的系统都是32位的 Linux操作系统厂商SUSE已经宣布专门为Raspberry Pi 3用户推出了一个64位Linux
winform中进行动态布局

在某些网页中 xff0c 对有些按钮进行选择后 xff0c 网页中的布局会增加或者减少 xff0c 无论增加还是减少 xff0c 都会按照顺序进行排序这个效果在winform中也是可以的 1 建立一个winform项目 2 拖动控件后 x
【排坑】 Ubuntu 16.04 修改 lightdm.conf 后图形界面崩溃，报错 the system is running in low-graphics mode

系统 Ubuntu 16 04 xff0c 英特尔最不值钱的复合显卡起因 xff1a 笔者想要用 docker 的 container 能显示出一次些基础的视觉效果 xff0c 类似于在 container 中跑 matplot 函数 x
Java 观察者模式详解

观察者模式是一种常见的设计模式 xff0c 也称作发布订阅模式它主要解决了对象之间的通知依赖关系问题在这种模式中 xff0c 一个对象 xff08 称作Subject xff09 维护着一个对象列表 xff0c 这些对象 xff08
解决Docker容器连接 Kafka 连接失败问题

提出问题近日助友 Docker 部署 Kafka 服务 xff0c 服务日志启动正常 xff0c 但客户端却无法连接往日曾踩过此坑 xff0c 然方法均源于博客 xff0c 其语焉不详 xff0c 不知为何不行 xff0c 亦不知为何行
Jenkins教程（七）实现 GitLab 提交/合并代码触发构建

楔子最近公司推行统一构建平台 xff08 基于 Jenkins 43 Kubernetes 插件创建 slave xff09 xff0c 原来部门自建的 Jenkins 不让用了迁移上统一构建平台的最大阻力是前端模块发布的问题 xff1
【问题记录】Java服务发起HTTPS请求报错sun.security.provider.certpath.SunCertPathBuilderException

问题报错今天上线了我开发的一个OAuth2单点登录客户端的实现 xff0c 在测试系统验证没问题 xff0c 到生产环境由于单点登录服务端HTTPS协议 xff0c 报错如下 xff1a I O error on POST request
【亲测可用】禁用AMQP配置中的明文身份验证机制-漏洞解决方法（RabbitMQ开启SSL附SpringBoot连接测试代码）

楔子近期公司程序被安全扫描出远程主机允许明文身份验证中风险漏洞 xff0c 查了下修复方案发现网上的都是把 RabbitMQ 的认证机制改了 xff0c 然后也没提供 Java 客户端连接测试结果 xff0c 底下全是登录失败的回帖
Amazon S3 对象存储Java API操作记录（Minio与S3 SDK两种实现）

缘起今年 2023年 2月的时候做了个适配Amazon S3对象存储接口的需求 xff0c 由于4月份自学考试临近 xff0c 一直在备考就拖着没总结记录下 xff0c 开发联调过程中也出现过一些奇葩的问题 xff0c 最近人刚从考试缓过
【问题解决】RabbitMQ启动出现epmd error for host xx.xx: nxdomain (non-existing domain)

问题描述 k8s 或普通容器或 Linux 部署的RabbitMQ启动时出现了 epmd error for host xx xx nxdomain non existing domain 错误 xff0c MQ无法启动成功其中 xx

随机推荐

MapReduce的编程开发——排序

文章目录前言一启动Hadoop二环境搭配三普通排序实验四二次排序实验五倒序索引实验总结前言本文主要是学习MapReduce的学习笔记 xff0c 对所学内容进行记录实验环境 xff1a 1 Linux Ubuntu 16
【问题解决】Kafka报错 Bootstrap broker x.x.x.x:9092 (id: -1 rack: null) disconnected

问题复现近日针对某一客户需求开发了一个需要使用Kafka的功能 xff0c 功能是什么暂且不论 xff0c 在本地虚机的Kafka连接一切正常遂放到测试服务器上验证功能 xff0c 以下是监听topic成功和警告报错 xff1a span
Ubuntu14.10登录界面隐藏其他用户登录窗口

上次装完MySQL后每次开机登录界面都会有一个mysql用户登录框在管理员用户下边感觉很碍眼记得上次在安装MySQL时就屏蔽了mysql用户登录 xff0c 可为何还会在登录界面显示比较纳闷了在网上找很多方法都没有用感觉千篇一律
Hadoop64位版本安装后遇到的警告处理

在使用hadoop的过程中 xff0c 会遇到一个警告 xff0c 内容如下 xff1a WARN util NativeCodeLoader Unable to load native hadoop library for your pl
【MFC基础教程】MFC 中常用类，宏，函数介绍

一常用类 CRect xff1a 用来表示矩形的类 xff0c 拥有四个成员变量 xff1a top left bottom right 分别表是左上角和右下角的坐标可以通过以下的方法构造 xff1a CRect int l int
从cas-overlay-template安装apereo cas 6.1.x并连接CAS客户端

一什么是单点登录简单点说单点登录的英文名称为Single Sign On xff0c 简写为SSO xff0c 它是一个用户认证的过程 xff0c 允许用户一次性进行认证之后 xff0c 就访问系统中不同的应用 xff1b 而不需要访
linux教程：[4]配置Tomcat开机启动

我们在linux下安装好tomcat之后 xff1b 经常是需要配置到开机启动的 xff1b 这样的话就不需要我们每次重启linux服务器之后自己在登陆运行startup sh文件启动tomcat了本次的演示环境是在centos7中完成的
用word2016 写CSDN 博客

在word2016 中点击文件 61 gt 共享 61 gt 发布至博客下面点击立即注册在这个里面选择其他 xff0c xff08 这里我说的是 CSDN 博客 xff09 http write blog csdn net xml
详解cocos2d帧率FPS

详解cocos2d帧率FPS 最近在使用coco2d js写一个游戏的时候需要将帧率实时显示出来于是搜索了一下获得FPS有下面几个方法 cc director getAnimationInterval cc director getS
Eclipse本地运行与远程提交MapReduce程序的步骤详解

1 下载eclipse插件此插件只是方便我们在eclipse上查看hdfs集群上的数据而已 1 1 下载对应版本的 hadoop eclipse plugin XXX jar 并将其复制到eclipse下的plugin的目录下 xff0c
sagalbot/vue-select 选中元素变动事件(:on-change 踩坑)

文章目录场景分析方案 amp amp 遇到的坑源码场景需要根据选中元素为依赖获取一个计算属性 array 此时computed不能满足分析官方文档的介绍 An optional callback function that is
客户需求VS最终软件交付

客户起初要求的样子 xff0c 和最终项目交付时的样子 xff0c 非常真实你永远不知道开发过程中有哪些或深或浅 xff0c 或近或远的弯弯绕绕在等着你回复干货获取精选干货视频教程回复加群加入疑难问题攻坚交流群回复 mat
mapreduce python编程实例

mapreduce python编程实例 1 mapreduce使用python WordCount实例 1 1 mapper函数使用 vi mapper py usr bin python coding utf 8 Filename ma
Centos7安装KVM虚拟化

Centos7安装部署KVM 一配置网桥 1 备份原来的配置文件2 修改配置文件a 修改已连接的网卡配置文件以ifcfg eno1为例 b 配置网桥配置文件 xff08 以ifcfg br0为例 xff09 c 重启网卡 xff08 建
Nanopi M4 基于Opencv 打开USB摄像头

一环境选择首次使用Nanopi M4 ARM板 xff0c 最初加载的是官方给的rk3399 sd friendlydesktop bionic 4 4 arm64 20190523 img xff0c 但我最终放弃使用该系统 xff0
“学C语言计划”后续

从上一篇日记学C语言计划到现在已经过去了一个季节了季节翻页 xff0c 而我菜鸟依旧 xff01 连大自然节奏都跟不上 xff0c 这真是要作死的节奏啊几天前 xff0c 考完了高数和C语言 xff0c 顺便玩完了后天要考英语
解决KEIL中ARM编译器不能编译的问题

keil编译器出现问题 xff0c 根据提示意思就是ARM编译器选择不对的问题 Target 39 Printf 39 uses ARM Compiler 39 V5 06 update 6 build 750 39 which is no
C++ ZeroMQ 发布订阅模式例子跟注意事项

发布订阅模式接收端 xff1a void context void subscriber 第一步 xff1a zmq ctx new 创建context对象 context 61 zmq ctx new 第二步 xff1a 创建socke
目标检测算法——anchor free

一 anchor free 概述 1 先要知道anchor 是什么 xff08 这需要先了解二阶段如faster rcnn xff0c 一阶检测器如YOLO V2以后或SSD等 xff09 在过去 xff0c 目标检测通常被建模为对候选框的
度量学习（Metric learning）—— 基于分类损失函数（softmax、交叉熵、cosface、arcface）

概述首先 xff0c 我们把loss归为两类 xff1a 一类是本篇讲述的基于softmax的 xff0c 一类是基于pair对的 xff08 如对比损失三元损失等 xff09 基于pair对的 xff0c 参考我的另一篇博客 xff1

度量学习（Metric learning）—— 基于分类损失函数（softmax、交叉熵、cosface、arcface）

度量学习（Metric learning）—— 基于分类损失函数（softmax、交叉熵、cosface、arcface） 的相关文章

随机推荐

热门标签

度量学习（Metric learning）—— 基于分类损失函数（softmax、交叉熵、cosface、arcface）的相关文章