人脸识别“SphereFace: Deep Hypersphere Embedding for Face Recognition”

2023-05-16

在开放集中进行人脸识别，理想的特征最大的类内差距应小于最小的类间差距。作者提出了angular softmax（A-Softmax）损失函数学习angularly discriminative features。在球面流形中增加判别约束，符合人脸分布在流形上的假设。此外，角度的边距使用参数m进行量化。改方法只改了损失函数，使用经典的CNN结构上训练人脸识别模型，在Megaface上获得排名第一。

一、复习一下人脸识别相关内容：
人脸识别分为人脸认证和人脸验证，人脸人证将人脸分类到某个ID，人脸验证时输入一对人脸，判断是否为同一个ID。人脸识别可以在闭集合和开放集合上测试，如下图所示。
这里写图片描述
在闭集合上测试，所有的需要测试的ID在训练集中都存在，这相当于将测试人脸分类到某个ID，人脸验证相当于对一对人脸分别识别，判断id是否为同一个。在开放集合中，测试id与训练id不重叠，此时一般提取人脸特征，人脸认证相当于probe和gallery中每个人脸进行验证。开放集合人脸识别是距离学习问题，核心是学习好的特征。好的特征使得最大的类内差距小于最小的类间差距。

二、softmax损失的问题
softmax损失仅学习分辨性不够强的特征，一些方法结合softmax loss和contrastive loss，center loss。FaceNet使用了triplet losss。center loss仅能使得类内紧凑。contrastive loss和triplet loss需要pair/triplet 挖掘过程，耗时。所有的这些方法都使用欧式距离。

三、改进的softmax损失
softmax 损失学习到的特征呈角度分布，说明欧式距离损失和softmax损失相容度不好。论文提出了角度距离。以二分类问题为例，softmax 损失决策边界为：
$(W_1-W_2)x+b_1-b_2=0$
论文约束 $||W_1||=||W_2||=1$ , $b_1=b_2=0$ ，决策边界成为:
$||x||(cos(\theta_1)-cos(\theta_2))=0$ ,
其中 $\theta_i$ 是 $W_i$ 和x之间的夹角，新的决策边界只依赖 $\theta_1$ 和 $\theta_2$ ，改进后的softmax损失可以直接优化角度，CNN可以学到呈角度分布的特征。这样第i类的特征相比其他类具有较小的 $\theta_i$ 。

接下来将损失改到angular softmax，引入整数m，量化决策边界。对二分类问题，类别1和类别2的决策边界不一样，分别为：
$||x||(cos(m\theta_1)-cos(\theta_2))=0$
$||x||(cos(\theta_1)-cos(m\theta_2))=0$
m控制角度距离的尺寸，二分类问题可扩展到多分类问题，通过优化A-Softmax，决策区域分的更开，拉大了类间距离，压缩了类内距离。几种损失函数学到的特征分布如下图所示，
这里写图片描述

A-Softmax具有清晰的几何标识，学到的特征构建了一个角度距离判别法，等价于球流形上的geodesic距离，鉴于A-Softmax loss与球流形之间的联系，论文提出的方法成为SphereFace。欧拉距离损失，改进Softmax损失，A-Softmax损失的几何标识如下图所示，第一行为2D特征约束，第二行为3D特征约束。
这里写图片描述

论文使用的几种CNN网络：
这里写图片描述

实验结果
使用WebFace训练，训练使用的数据量是0.49M，与DeepFace，FaceNet，VGGFace相比很小。
引入整数m对识别结果的影响：
这里写图片描述

在LFW和YTF数据集上的对比：
这里写图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人脸识别“SphereFace: Deep Hypersphere Embedding for Face Recognition” 的相关文章

ideaskin软件下载_Idea for android app

App idea generator free app for inspiring and giving idea to make an app This app will show three random words on the sc
RS雷达转Velodyne雷达数据Failed to find match for field ‘intensity‘

目录 xff1a 问题分析解决问题因为目前很多SLAM框架支持的激光雷达都是Velodyne型号的 xff0c 对于速腾RS雷达的使用者来说 xff0c 需要对数据进行转换 xff0c 其实现在速腾的雷达已经支持输出XYZI和XYZIR
C++调试报错 no match for operator...operand types

在调试C 43 43 代码遇到一个小错误 xff0c 但是也比较常见 xff0c 报错如下 xff1a error span class token operator span no match span class token keywo
RuntimeError: Error compiling objects for extension手把手带你解决（超详细）

我在执行python setup py build develop的时候 xff0c 编译出错 xff0c 显示RuntimeError Error compiling objects for extension 我在网上找了一些帖子 xf
DeepLiDAR: Deep Surface Normal Guided Depth Prediction for Outdoor Scene from Sparse LiDAR

DeepLiDAR复现一下载二配置环境依赖三数据集准备四预处理1 表面法线 surface normal https github com valgur surface normal 2 运行设置 xff08 1 xff09 报错
Deep Compression阅读理解及Caffe源码修改

更新 xff1a 没想到这篇文章写出后有这么多人关注和索要源码 xff0c 有点受宠若惊说来惭愧 xff0c 这个工作当时做的很粗糙 xff0c 源码修改的比较乱 xff0c 所以一直不太好拿出手最近终于有时间整理了一下代码并开源出来了
Trajectory generation for quadrotor while tracking a moving target in cluttered environment

四旋翼在杂波环境下跟踪运动目标的轨迹生成摘要1 文章主要贡献2 前言2 1 轨迹公式2 2 实现结构 3 跟踪轨迹生成3 1 标称路径点生成3 2 可行路径点生成3 3 安全飞行走廊生成3 4 代价函数3 5 强制约束3 6 求解跟踪轨迹
翻译-Frustum PointNets for 3D Object Detection from RGB-D Data

Frustum PointNets for 3D Object Detection from RGB D Data 摘要介绍相关工作从RGB D数据中检测三维物体基于前视图图像的方法 xff1a 基于鸟瞰图的方法基于3D的方法点云的深度
nn.Embedding

在PyTorch中针对词向量有一个专门的层nn Embedding 用来实现词与词向量的映射 nn Embedding具有一个权重 weight 形状是 vocab size embedding dim Embedding层的输入形状是b
Go语言学习15-基本流程控制

基本流程控制流程控制对比 Go 和 C 基本流程控制 1 代码块和作用域 2 if 语句 3 switch语句 3 1 表达式switch语句 3 2 类型switch语句 4 for 语句 4 1 for 子句 4 2 range 子句
Python 的 map、列表推导、循环效率比较

话不多说直接上代码 1 准备数据三个列表 import time x x1 x2 for i in range 1000000 x append i x1 append i x2 append i 2 开始表演 2 1 for循环 st
教妹学Java(十五)：for循环详解

你好呀我是沉默王二一枚颜值与才华俱在的程序员本篇教程通过我和三妹对话的形式来谈一谈 for while do while 循环之间的差别以及重点介绍一下 for 循环 while do while 会在接下来的教程中单独介绍教妹学
matlab for循环坑

matlab 用 for 嵌套循环遍历数组时可能有 bug matlab octave 环境 linux Matlab R2018a 1 windows GNU Octave version 5 2 0 以 for x vector 的形
防弹 Groovy 脚本嵌入

我正在开发一个服务器应用程序可以通过用户提供的 Groovy 脚本进行扩展显然我想确保这些脚本在非常严格的沙箱中运行它们不能破坏核心应用程序代码或消耗太多资源以使服务器超载我研究了各种可能性最终的解决方案可能是这些的组合在非常
torch rnn网络中，embedding.weight会反向更新吗？

结论在 PyTorch 中如果在训练中使用了 embedding 层那么 embedding weight 会被反向更新这是因为在训练过程中模型的参数会根据损失函数的反向传播进行更新而 embedding 层的参数 embedd
嵌入式 Facebook Like-Box 不允许我设计它。为什么？

我正在尝试在我的网站页面上放置一个 Facebook Like Box 然后通过我自己的 CSS 对其进行样式设置主要是为了增加 div stream content 的高度这个想法是让 FB feed 充当新闻 feed 但我不希望用
如何在 RNN 中嵌入句子序列？

我正在尝试制作一个 RNN 模型在 Pytorch 中它需要几个句子然后将其分类为Class 0 or Class 1 为了解决这个问题我们假设句子的 max len 为 4 max amount of time steps 为 5
嵌入层 Keras 的可变长度输入

我有一个可变大小的文本语料库我正在尝试使用 keras 中的嵌入层将文本输入 LSTM 模型我的代码看起来像这样 import numpy as np from keras layers import Embedding Input L
如何在张量流中使用非常大（>2M）的词嵌入？

我正在运行一个具有非常大的词嵌入 gt 2M 词的模型当我使用 tf embedding lookup 时它需要一个很大的矩阵当我运行时我随后出现了 GPU 内存错误如果我减小嵌入的大小一切都会正常有没有办法处理更大的嵌入
如何在 Angular 模板中嵌入 GitHub gist？

角度忽略script其模板中包含标签但加载 GitHub gist 需要它们执行此操作的最佳做法是什么使用iframe 创造script动态标记或者是其他东西一种方法是创建一个iframe with script里面并在你希望你

随机推荐

解决vnc灰屏，黑屏，鼠标大黑叉情况

解决 linux 上 VNC 安装好后登录出现黑屏灰屏鼠标是大黑叉情况安装系统支持包组服务器 xff08 Centos rhel xff09 在安装字符界面操作系统时默认是不会安装相关图形包组的 yumgroupinstall 34
Incorrect datetime value

今天在开发库上给一个表添加字段时候 xff0c 发现居然报错 root 64 DB 06 14 42 gt ALTER TABLE 96 DB 96 96 user 96 ADD COLUMN 96 status mode 96 TINYI
5个最佳免费Linux杀毒软件

Linux的防病毒软件 xff0c 开玩笑吧 xff1f Linux不是很安全吗 xff1f 很多Linux新手都这样认为 xff0c 看到标题不要犹豫 xff0c 读完全文你就会从中找到答案首先 xff0c Linux比其它操作系统更稳
Mac 鼠须管 Rime 输入法安装五笔输入法教程

Mac 鼠须管 Rime 输入法安装五笔输入法教程相关链接极点五笔方案 github xff1a https github com KyleBing r RIME 官网 xff1a https rime im RIME github
MapReduce实现与自定义词典文件基于hanLP的中文分词详解

前言 xff1a 文本分类任务的第 1步 xff0c 就是对语料进行分词在单机模式下 xff0c 可以选择python jieba分词 xff0c 使用起来较方便但是如果希望在Hadoop集群上通过mapreduce程序来进行分词 xf
单点登录-CAS登录流程

2019独角兽企业重金招聘Python工程师标准 gt gt gt 第1 2两个章节摘抄自http www cnblogs com lihuidu p 6495247 html xff0c 第3部分来源于CAS官网 1 从项目部署结构说起
Hadoop集群（第5期）_Hadoop安装配置

1 集群部署介绍 1 1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台以Hadoop分布式文件系统 xff08 HDFS xff0c Hadoop Distributed Filesystem xff
服务器系统没有界面,云服务器没有图形界面

云服务器没有图形界面内容精选换一换使用鲲鹏弹性云服务器没有图形界面操作某些文件的时候你一定需要一个好用的编辑器那么神器vim就得必须说说啦超级好用先看图 vim有很多快捷操作但是对于新人来说仅仅用于日常修改文件部分信息
ERROR 1129 (HY000): Host '192.168.7.210' is blocked because of many connection errors; unblock with ...

一问题现象 mysql远程连接报错 ERROR 1129 HY000 Host 39 192 168 7 210 39 is blocked because of many connection errors unblock with 3
大裕量Softmax 损失函数--Large-Margin Softmax Loss for Convolutional Neural Networks

ICML2016 Large Margin Softmax Loss for Convolutional Neural Networks 本文针对CNN网络中的 Softmax Loss 做出改进 xff0c 使之成为 Large Marg
Deep Learning 学习笔记（一）——softmax Regression

Deep Learning 学习笔记 xff08 一 xff09 softmax Regression 茫然中不知道该做什么 xff0c 更看不到希望偶然看到coursera上有Andrew Ng教授的机器学习课程以及他UFLDL上的深度
Debian 从稳定版升级到测试版

2019独角兽企业重金招聘Python工程师标准 gt gt gt 1 关于Debian 的发行版本 Debian 一直维护着至少三个发行版稳定版 stable xff0c 测试版 testing 和不稳定版 unstable 稳定版
VS2010中的调试技巧

今天的博文将介绍Visual Studio中的一些实用调试技巧这是受我朋友Scott Cate 他发表过几十篇很棒的VS技术文章启发他最近告诉我 xff0c 许多Visual Studio下的程序员 xff0c 甚至一些很有经验的开发
把mysql的数据导出成txt

把mysql的数据导出成txt select a from b into outfile 39 sqlfile a txt 39 my ini里需要设置secure file priv 61 d sqlfile linux中是 etc my
理解神经网络：从神经元到RNN、CNN、深度学习

本文为 AI 研习社编译的技术博客 xff0c 原标题 xff1a Understanding Neural Networks From neuron to RNN CNN and Deep Learning 作者 vibhor nigam
debian 系统版本划分、识别、演进的释疑（升级系统须知）

2019独角兽企业重金招聘Python工程师标准 gt gt gt debian 系统版本划分识别演进的释疑 xff08 升级系统须知 xff09 http my oschina net emptytimespace blog 84
vnc远程不能登录，总是提示认证错误解决

vnc无法登陆 xff0c 总是提示验证错误 34 An authentication error occurred See the server error log for details 34 then the server will
JavaScript 二进制转文件

关于在javascript下 xff0c 如何将二进制转换成相应的文件并下载首先 xff0c 我们需要得到二进制的数据以及相应的文件格式 xff0c 没有相应的格式也可以 xff0c 可以通过二进制来判断 xff0c 但相对会麻烦很多 x
子网数、主机数与子网掩码的关系

直接拿实际的例子说吧 xff0c 这样容易理解 1 利用子网数目计算子网掩码把B类地址172 16 0 0划分成30个子网络 xff0c 它的子网掩码是多少 xff1f 将子网络数目30转换成二进制表示11110 统计一下这个二进制的数共
人脸识别“SphereFace: Deep Hypersphere Embedding for Face Recognition”

在开放集中进行人脸识别 xff0c 理想的特征最大的类内差距应小于最小的类间差距作者提出了angular softmax xff08 A Softmax xff09 损失函数学习angularly discriminative featu

人脸识别“SphereFace: Deep Hypersphere Embedding for Face Recognition”

人脸识别“SphereFace: Deep Hypersphere Embedding for Face Recognition” 的相关文章

随机推荐

热门标签