TensorFlow框架做实时人脸识别小项目（二）

2023-11-16

在第一部分中，分析了整个小项目的体系，重点讨论了用于人脸检测对齐的mtcnn网络的实现原理，并利用笔记本电脑自带的摄像头进行了测试。今天在这里要讨论的重点是人脸识别中的核心部分——facenet网络。

facenet是Google开源的人脸识别框架，它的作用是把输入的人脸图像映射为多维特征向量，相当于对不同的人脸进行了不同的编码，同一个人脸的图像生成的编码几乎一致，不同的人脸图像生成的编码差异非常大，并以此达到识别的目的。设计一个能够达到这样效果的映射的网络是一个很难的问题，我们下面就一步一步来看facenet是怎样解决这个问题的。

首先，facenet的结构是这样的：

facenet网络的输入有多种不同的大小，中间部分是一个深度卷积神经网络，与其他普通CNN没有多大区别。facenet不一样的地方在于后面部分，它对深度卷积神经网络的输出做了一个L2正则化，然后再对输出进行了embedding，直接将embedding的映射结果作为特征向量输出。facenet并没有像其他一般的CNN用softmax作为损失函数，而是设计了一种新的损失——triplet loss。

在理想的情况下，特征向量之间的距离可以直接反映人脸的相似度，即：

对于同一个人的两张人脸图像，对应的向量之间的欧几里得距离比较小
对于不同人的两张图像，对应的向量之间的欧几里得距离比较大

假设人脸图像为x1和x2，对应的特征为f(x1)和f(x2)。当x1和x2对应的是同一个人脸时，其距离II f(x1)-f(x2) II应该很小，而当x1和x2对应的是不同的人脸时，其距离II f(x1)-f(x2) II应该很大。

然而事实并非如此。在一般CNN网络中，最后的输出经过softmax分类器，使用的是softmax损失。这个损失是不同类别间的损失。对于人脸来说，每一个人脸就是一个人。看起来似乎很合理，但是用softmax表示损失，以此区别出不同的人是不可行的。softmax本质上没有对每一类的向量表示之间的距离做出要求。用softmax分类的结果，可能同一个类中的向量，它的类间距比不同类中的向量间距还要大。对于这种情况，就要考虑设计新的损失函数解决问题。

下面重点看triplet loss的定义及原理

三元组损失(triplet loss)的原理：既然目标是特征之间的距离应当具备某些性质，那么就围绕这个距离来设计损失。具体的，每次都在训练数据中取出三张人脸图像，第一张图像记为，第二张图像记为

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人脸识别

tensorflow

TensorFlow框架做实时人脸识别小项目（二）的相关文章

在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
如何在google colab中降级到tensorflow-gpu版本1.12

我正在运行一个仅与旧版本的tensorflow GPU兼容的GAN 因此我需要将google colab中的tensorflow gpu从1 15降级到1 12 我尝试使用本中建议的以下命令thread https stackoverflo
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
在 keras 中集成采样的 softmax 失败

基于如何在 Keras 模型中使用 TensorFlow 的采样 softmax 损失函数 https stackoverflow com questions 47892380 how can i use tensorflows sampl
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
张量流如何处理无法存储在一个盒子中的大变量

我想通过训练超过十亿特征维度的数据来训练 DNN 模型因此第一层权重矩阵的形状将为 1 000 000 000 512 这个权重矩阵太大无法存储在一个盒子中目前有没有什么解决方案来处理这么大的变量例如将大的权重矩阵划分为多个框 Up
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
使用 tf.estimator.Estimator 加载检查点和微调

我们正在尝试将旧的训练代码转换为更符合 tf estimator Estimator 的代码在初始代码中我们针对目标数据集微调原始模型在使用以下组合进行训练之前仅从检查点加载一些层要恢复的变量 and init fn与监控培训课程

随机推荐

linux命令详解及软件安装(全)

环境搭建环境搭建 Vmware 账号管理开机关机目录管理文件管理文件操作 touch cat tac more less grep wc vim 磁盘管理 iostat sar df du 内存管理 free CPU管理 top
2023华为OD机试真题Java实现【士兵过河/动态规划】

题目内容一支N个士兵的军队正在趁夜色逃亡途中遇到一条湍急的大河敌军在T的时长后到达河面没到过对岸的士兵都会被消灭现在军队只找到了1只小船这船最多能同时坐上2个士兵 1 当1个士兵划船过河用时为 a i 0 lt i lt N
记录vue js-table2excel 导出带有多张图片到Excel

新建js table2excel js文件 eslint disable let idTmr const getExplorer gt let explorer window navigator userAgent ie if explor
Springmvc拦截器三个方法的执行时机

一拦截器三个方法分别是 1 1 preHandle 预处理回调方法实现处理器的预处理如登录检查第三个参数为响应的处理器如具体的Controller实现返回值 true表示继续流程如调用下一个拦截器或处理器 false表示流程中
微信小程序与应用服务的关系和“代码安全“

今天给客户回答了下小程序项目的代码安全问题他担心源代码提交以及发布系统后被第三方知晓源代码导致代码泄露虽然作为程序员来说这个问题不用考虑但是非技术人员似懂非懂所以我还是做了一个解释一般做微信小程序开发需要知道微信小程序只是纯
记录PaddleOcr的使用2 -- GPU

项目场景之前使用了cpu 但是效率感人所以想尝试一下GPU的版本安装环境 windows下使用的别问问就是没有有GPU的服务器 1 python 3 7 如果是linux建议3 8 2 pip 版本 20 2 2或更高版本 64
LALR(1)语法自动分析生成器Mathew

首次写博客文采不好大家不要见笑额简介 Mathew 马修马修名字源于魔力女管家里的星神马修马修是一个LALR 1 型活动板房式的语法自动分析生成器马修继承了Lemon 也许大家对LEX和YACC比较熟悉这两个工具配合使用可以
记录Chrome截屏整个页面的命令

F12 右键检查进入开发者工具调出命令 MAC command shift P Window ctrl shift P 输入命令 capture full size screenshot
C/C++如何输入包含空格的字符串

对于C 字符串的输入我们看一下下面这段代码 string s 定义空字符串 cin gt gt s 输入字符串 cout lt lt s 打印但我们会发现如果我们输入了还有空格的字符串 s里读入的字符串遇到空格回车 tab都会结束比如
目前 AIGC 工具到底能帮我们做什么？

最近直播超级多预约保你有收获今天腾讯发布了混元大模型大模型赛道越来越内卷了今天咱们来聊聊目前的 AIGC 工具能帮助我们做什么 AIGC 的本质是由 AI 来生产内容通过自然语言交互的方式让 AIGC 工具输出内容 AIGC 工
20-文件下载及读取漏洞

WEB 漏洞文件操作之文件下载读取全解思维导图 1 文件被解析则是文件解析漏洞 2 显示源代码则是文件读取漏洞 3 提示文件下载则是文件下载漏洞文件下载漏洞利用条件 1 存在读文件的函数和操作 2 读取文件的路径用户可控且未校
Android 保存资源图片到相册最新写法适用于Android10.0及以上

博主前些天发现了一个巨牛的人工智能学习网站通俗易懂风趣幽默忍不住也分享一下给大家点击跳转到网站一首先在AndroidManifest xml中加入权限
APFS 文件系统探究

本文的创作初衷是因为我发现从底层详解 APFS 的资料很少所以自己来进行了一些探究和整理一点说明如果你在看 APFS 的文档或者其他内容不要把高层级的分区理解成 Windows 中的分区因为 APFS 里卷 Volume 才是显示
OUT指令时，就进入了I/O端口读写周期

1 译码电路的输入信号每当CPU执行IN或者OUT指令时就进入了I O端口读写周期此时首先是端口地址有效然后是I O读写控制信号 IOR和 IOW有效把对端口地址译码而产生的译码信号同 IOR和 IOW结合起来一同控制对I O端口
聊聊FFT

关于FFT 全称为快速傅里叶变换目的是把时域的信号转变为频域的信号具体的科学解释及计算方程组可以去查百度百科不过小编不建议这么做因为查了也看不懂的先看一张都能看懂的图这是某种食物的配方表每种配方包含了多少比例标注的很清楚对于
计算机网络教程_第二章物理层_整理与复习

计算机网络教程第一章概述第二章物理层第三章数据链路层提示写完文章后目录可以自动生成如何生成可参考右边的帮助文档文章目录计算机网络教程 1 物理层的作用及主要任务 2 数据传输的方式并行串行异步同步 P40 3
python 设置下载源，全局设置

推荐使用豆瓣的个人感觉最好用当然你如果喜欢其它的也可以设置 pip config set golbal index url https pypi douban com simple 设置成功 windows 提示的配置文件在 ini
Spyder上使用tensorflow训练完成时出现SystemExit异常

使用spyder tensorflow实现迁移学习训练inception v3网络训练完成后提示 SystemExit home zhijuan anaconda3 lib site packages python3 6 site pac
深度学习图像分割综述

文章目录前言语义分割实例分割技术路线掩膜建议分类法先检测再分割法标记像素后聚类法密集滑动窗口法参考前言图像分割在计算机视觉中是个重要的任务在地理信息系统医学影像自动驾驶机器人等领域都有着很重要的应用技术支持作用
TensorFlow框架做实时人脸识别小项目（二）

在第一部分中分析了整个小项目的体系重点讨论了用于人脸检测对齐的mtcnn网络的实现原理并利用笔记本电脑自带的摄像头进行了测试今天在这里要讨论的重点是人脸识别中的核心部分 facenet网络 facenet是Google开源的人脸识别

TensorFlow框架做实时人脸识别小项目（二）

TensorFlow框架做实时人脸识别小项目（二） 的相关文章

随机推荐

热门标签

TensorFlow框架做实时人脸识别小项目（二）的相关文章