吴恩达老师深度学习视频课笔记：人脸识别

2023-11-01

什么是人脸识别：人脸验证和人脸识别的区别，如下图：

One-shot learning：人脸识别所面临的挑战就是需要解决一次学习(one-shot learning)问题。这意味着在绝大多数人脸识别应用中你需要通过单单一张图像或者单单一个人脸图像就能去识别这个人，因为大多数人脸识别系统中每个人可能只有一张图像。要让人脸识别能够做到一次学习，需要做的是学习相似(similarity)函数，如下图，输入两张图像然后输出两张图像的差异值。在识别过程中，如果两张图像的差异值小于某个阈值τ(是一个超参数)，那么这时就能预测两张图像是同一个人，如果差异值大于τ，就能预测这是不同的两个人。这是解决人脸验证问题的一个可行办法。

Siamese网络：学习相似函数的一个方式是用Siamese网络，如下图，输入图像x¹，然后通过一系列卷积、池化和全连接层，最终得到特征向量，假如它的长度为128，图像编码。假如你要比较两张图像的话，例如这里的第一张和第二张图像，你需要做的就是将第二张图像输入到有同样参数的同样的神经网络，然后得到一个不同的128维向量。然后你需要定义这两种图像的距离d，可把d看作距离函数，即范数来计算它们的差值，这一般被称为Siamese神经网络架构。如DeepFace系统。

Triplet loss：要想通过学习神经网络的参数来得到优质的人脸图像编码，一个方法就是定义三元组损失函数(triplet loss function)然后应用梯度下降。为了应用三元组损失函数，你需要比较成对的图像，如下图，看一个anchor图像和一个positive图像距离很接近；看一个anchor图像和一个negative图像距离很远。三元组损失代表你通常会同时看三张图像。你想要的网络的参数或编码能够满足以下特性：‖||f(A)-f(P)||²+α≤‖||f(A)-f(N)||², α也是超参数。为了确保网络对于所有的编码不会总是输出0，也为了确保它不会把所有的编码都设成互相相等的，需要一个α。

三元组损失函数的定义基于三张图像A、P、N，如下图，L(A,P,N)=max(||f(A)-f(P)||²-||f(A)-f(N)||²+α, 0)，最小化损失函数L(A,P,N)。代价函数(cost function)是训练集中单个三元组损失的总和。训练学习算法，对代价函数应用梯度下降。为了定义三元组的数据集，需要成对的A和P。为了构建训练集，尽可能选择难训练(hard to train)的三元组A、P、N，即所有的三元组都满足条件：d(A, P)+ α≤d(A,N)并且d(A,P)≈d(A,N)，不能随机地选择三元组。

Face verification and binary classification：将人类识别当成一个二分类问题，可以选取Siamese网络，如下图，使其同时计算比如128维的向量，然后将其输入到逻辑回归单元，然后进行预测，如果是相同的人，输出为1，若是不同的人输出为0，这就把人脸识别问题转换成一个二分类问题。训练这种系统时，可以替换triplet loss的方法。

GitHub： https://github.com/fengbingchun/NN_Test

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Deep Learning

face

吴恩达老师深度学习视频课笔记：人脸识别的相关文章

深度学习知识体系学习大全牛！！

搬来了大牛的博客点击直接前往 https www yuque com angsweet machine learning jian jie 配一张大牛的思维导图具体内容点进去都能看到数学机器学习语言算法深度学习书籍推荐东西
序列模型——自然语言处理与词嵌入（理论部分）

1 词汇表征深度学习已经给自然语言处理 Natural Language Process NLP 带来革命性的变革其中一个很关键的概念是词嵌入 word embedding 这是语言表示的一种方式可以让算法自动的了解一些类似的词例如
3D人体重建方法漫谈

转自 https blog csdn net Asimov Liu article details 96442990 1 概述 2 模型匹配的方法 2 1SMPL Skinned Multi Person Linear model 模型 2
word2vector学习笔记（一）

word2vector学习笔记一最近研究了一下google的开源项目word2vector http code google com p word2vec 其实这玩意算是神经网络在文本挖掘的一项成功应用本文是看了论文 Distribu
朴素贝叶斯分类器简介及C++实现(性别分类)

贝叶斯分类器是一种基于贝叶斯定理的简单概率分类器在机器学习中朴素贝叶斯分类器是一系列以假设特征之间强朴素独立下运用贝叶斯定理为基础的简单概率分类器朴素贝叶斯是文本分类的一种热门基准方法文本分类是以词频为特征判断文件所属类别或
深度学习论文：Deep Residual Learning for Image Recognition

论文 He Kaiming et al Deep residual learning for image recognition Proceedings of the IEEE conference on computer vision a
深度神经网络中的Inception模块介绍

深度神经网络 Deep Neural Networks DNN 或深度卷积网络中的Inception模块是由Google的Christian Szegedy等人提出包括Inception v1 Inception v2 Inception
libsvm库简介及使用

libsvm是基于支持向量机 support vector machine SVM 实现的开源库由台湾大学林智仁 Chih Jen Lin 教授等开发它主要用于分类支持二分类和多分类和回归它的License是BSD 3 Claus
Tensorflow错误InvalidArgumentError see above for traceback): No OpKernel was registered to support Op

调用tensorflow gpu运行错误错误信息如下 2023 06 21 15 36 14 007389 I tensorflow core platform cpu feature guard cc 141 Your CPU supp
pytorch 入门 DenseNet

知识点0 dense block的结构知识点1 定义dense block 知识点2 定义DenseNet的主体知识点3 add module 知识点 densenet是由多个这种结构串联而成的 import torch import
Transformer——《Attention is all you need》

本文是Google 机器翻译团队在2017 年发表提出了一个新的简单的网络模型 Transformer 该模型基于纯注意力机制 Attention mechanisms 完全抛弃了RNN和CNN网络结构在机器翻译任务上取得了很好的效果
Dilated Conv and Deformable Conv. 空洞卷积和可变形卷积

空洞卷积论文地址 https arxiv org pdf 1511 07122 pdf 可变形卷积论文地址 https arxiv org pdf 1703 06211 pdf 之前一直知道这两个方法一直没时间看论文和实现后面碰到越来越
深度学习中的验证集和超参数简介

大多数机器学习算法都有超参数可以设置来控制算法行为超参数的值不是通过学习算法本身学习出来的尽管我们可以设计一个嵌套的学习过程一个学习算法为另一个学习算法学出最优超参数在多项式回归示例中有一个超参数多项式的次数作为容量超参数
cs231n: How to Train a Neuron Network 如何训练神经网络

CS231N第六第七课时的一些笔记如何训练神经网络是一个比较琐碎的事情所以整理了一下以后训练Neuron Network的时候可以看一下 Activation Functions ReLu good ELU leaky ReLu no
16个车辆信息检测数据集收集汇总（简介及链接）

16个车辆信息检测数据集收集汇总简介及链接目录 1 UA DETRAC 2 BDD100K 自动驾驶数据集 3 综合汽车 CompCars 数据集 4 Stanford Cars Dataset 5 OpenData V11 0 车辆重
决策树(Decision Tree)简介

决策树 Decision Tree 及其变种是另一类将输入空间分成不同的区域每个区域有独立参数的算法决策树分类算法是一种基于实例的归纳学习方法它能从给定的无序的训练样本中提炼出树型的分类模型树中的每个非叶子节点记录了使用哪个特征来
深度学习中的优化算法之AdaGrad

之前在https blog csdn net fengbingchun article details 123955067 介绍过SGD Mini Batch Gradient Descent MBGD 有时提到SGD的时候其实指的是MB
【深度学习】模型评价指标

一分类任务分类任务一般有二分类多分类和多标签分类多分类表示分类任务中有多个类别但是对于每个样本有且仅有一个标签例如一张动物图片它只可能是猫狗虎等中的一种标签二分类特指分类任务中只有两个类别多标签一个样本可以有多个标
OpenFace库(Tadas Baltrusaitis)中基于HOG进行正脸人脸检测的测试代码

Tadas Baltrusaitis的OpenFace是一个开源的面部行为分析工具它的源码可以从https github com TadasBaltrusaitis OpenFace下载 OpenFace主要包括面部关键点检测 facia
CATransform3D 可以用来获取 Face Mesh 中的眼睛尺寸吗？

我正在尝试使用 ARKit 的 3D Face Mesh 获取眼睛的宽度和 2 只眼睛的距离我用过CA变换3D of ARAnchor struct CATransform3D CGFloat m11 m12 m13 m14 CGFloa

随机推荐

第二次作业：微信案例分析

2 1 介绍产品相关信息你选择的产品是微信为什么选择该产品作为分析微信是一款全方位的手机通讯应用帮助我们轻松连接全球好友微信可以通过SMS MMS网络发送短信进行视频聊天与好友一起玩游戏以及分享自己的生活到朋友圈让我们感
Stable Diffusion 个人推荐的各种模型及设置参数、扩展应用等合集（不断更新中）

本文主要是把平时使用的模型及其参数进行推荐和整理相关安装及其问题解决参考 Windows安装Stable Diffusion WebUI及问题解决记录运行使用时问题 Windows使用Stable Diffusion时遇到的各种问题整
Stack，ArrayDeque，LinkedList的区别

这段时间把疯狂JAVA再看了一遍发现Stack ArrayDeque LinkedList都可以作为栈使用所以就稍微从性能以及实现的细节对比这三者的区别类继承树由继承树看出三者都是Collection的间接实现类 ArrayDeq
js中数组删除对象的几种方式总结

1 关键字删除 2 splice删除 3 特殊位置删除一关键字删除关键字删除是通过js提供的关键字 delete手动删除数组的某一项使用delete删除掉数组中的元素后会把该下标出的值置为undefined 数组的长度不会变 ar
一个案例说明高层属性形式化验证

1 验证软件功能介绍 Beosin VaaS的业务逻辑验证软件是一款用来检测智能合约上层业务逻辑漏洞的软件基于合约的白皮书软件利用形式化方法首先对单个函数进行属性的描述在对单个函数进行属性的验证并通过后基于这些已验证属性抽取出
号传到服务器为空,URL 传+号到后台变空格问题解决方案

今天在调试客户端向服务器传递参数时参数中的全部变成了空格原因是URL中默认的将号转义了解决方法如下方法一修改客户端将客户端带的参数中的全部替换为 2B 这样参数传到服务器端时就能得到了方法二修改服务器端将空格替换
第六天作业

include
VC++操作SQLserver动态库【含源码】，及动态库使用教程。

VC 操作SQLserver动态库含源码动态库使用Demo程序演示 include
Unity Window触摸屏电脑和移动端Input触控，控制相机旋转缩放

Unity Window触摸屏电脑和移动端Input触控控制相机旋转缩放原理就是获取手指滑动的偏移量来计算代码帖出来 using UnityEngine using System using System Collections p
Codeforces 670C Cinema

题目链接 https codeforces com problemset problem 670 C include
numpy.array多维数组的切片操作总结

numpy array多维数组的切片操作总结一常规介绍 1 一维数组切片 2 二维数组的切片 3 维数超过 3 的多维数组可通过来简化操作 4 numpy中对切片元素的操作会影响原数组本身 5 array和list的对比 6 boo
100天精通Python（数据分析篇）——第61天：Pandas.to_datetime函数基础+代码实战（处理时间）

文章目录一 to datetime参数说明代码实战 1 arg 2 errors 3 dayfirst 4 yearfirst 5 utc 6 format 7 exact 8 unit 9 infer datetime format
qt designer文本输入框_Qt为输入框提供提示信息

当我们在使用一个陌生的软件时常常会感觉不知所措因此在写软件的时候都要考虑增加一些信息来帮助使用者比如说提供文字标签来告诉使用者某一块区域的作用是什么又或者干脆用一块区域滚动显示一些提示但这里要说的是一种很常见又有用的提示方式在输入
股指期货首次和二次开户条件

不少投资者都问到股指期货开户可以网上开通吗还是要去柜台办理由于股指期货具有双向交易以及T 0的特点在大盘下跌的时候也可以对冲或者赚取盈利深受投资者关注今天期货开户网为您详细讲解自然人申请开通股指期货的详细流程需提供的材料准入
网络编程（32）—— linux中销毁僵尸进程的四种方法

一 wait函数函数原型 pid t wait int status 描述 wait可以回收任意一个僵尸进程只要系统中存在僵尸进程调用一次wait 就会回收一个僵尸进程参数说明 status 当子进程结束之后其进入僵尸进程状态其
A Toolkit for Generating Code Knowledge Graphs生成代码知识图谱的工具

事实证明知识图谱在多种支持语义搜索和自然语言理解的应用程序方面非常有用本文提出GraphGen4Code 一种工具集构建代码的知识图谱支持程序搜索代码理解 bug检测和代码自动化等 GraphGen4Code获取图中代表类函数和方
顺序表链式结构实现多项式相加。参照《数据结构》中的伪代码

写了一个晚上只是把多项式相加的实现了多项式的销毁也没写完其中LinkList也没太完全弄明白书里到底是什么意思数据结构的书太乱了给的是伪代码也就算了还不给给全真是太闹心了 include
数字游民让你实现边旅游边工作

一篇标题是中国数字游民放弃大城市当起背包客寻求好去处的报告吸引了我的注意中国正赶上一种全球性潮流许多技术熟练的从业者选择更便宜风景更宜人的工作场所长期居住这种人被称作数字游民这篇报导的摘要是这样描述的一天的辛苦工作之后
[docker] 在需要使用opencv的时候常遇到的缺少动态链接库问题

问题当import cv2时出现 ImportError 缺少动态链接库 libgthread 2 0 so 0 libSM so 6 libXrender so 1 libXext so 6 等等解决方法 apt get update
吴恩达老师深度学习视频课笔记：人脸识别

什么是人脸识别人脸验证和人脸识别的区别如下图 One shot learning 人脸识别所面临的挑战就是需要解决一次学习 one shot learning 问题这意味着在绝大多数人脸识别应用中你需要通过单单一张图像或者单单一个人脸

吴恩达老师深度学习视频课笔记：人脸识别

吴恩达老师深度学习视频课笔记：人脸识别 的相关文章

随机推荐

热门标签

吴恩达老师深度学习视频课笔记：人脸识别的相关文章