翠竹林 Opencv+C++之人脸识别

2023-11-19

最近一直在忙课程，老师让我看看他的论文也没放在心上。总算闲下来，看了他在人脸识别方面的相关论文，拿出一篇放在博客上跟大家共同分析下。在看以下内容前，首先要阅读下徐勇老师的这篇论文

A Two-Phase Test Sample Sparse Representation Method for Use With Face Recognition；当前人脸识别方面最热的方法就是稀疏表示方法（sparse represent），其主要思想是利用线性的或者非线性的表示方法将检查样本用训练样本表示出来，训练样本前的系数为代表比重，选取比重较大的训练样本所属的类来标记测试样本。这种方法在某些模式识别中效果较好，但是其原理并不明确，没有很好的理论基础，所以就方法的科学性而言相对欠缺。徐老师提出两步法，第一步利用所有训练样本来标示出测试样本，并提取M近邻训练样本；第二步利用第一步中提取的M近邻样本表出测试样本，选取代表比重大的训练样本所属于的类来标记测试样本。

关于该方法的理论，希望大家去下载论文阅读，这里就不在多说，重点在于算法的实现上：算法中将实现分为两步，第一步是用所有训练样本表示出测试样本，可以用SVD来计算出系数阵，但在这之前要通过PCA或者LDA的方法给特征向量降维；

opencv中PCA有现成的方法,具体代码如下（我的风格是先给出代码，在代码中介绍实现逻辑）

#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>

#include <fstream>
#include <sstream>

using namespace cv;
using namespace std;


//将给出的图像回归为值域在0~255之间的正常图像
Mat norm_0_255(const Mat& src) {
    // 构建返回图像矩阵
    Mat dst;
    switch(src.channels()) {
    case 1://根据图像通道情况选择不同的回归函数
        cv::normalize(src, dst, 0, 255, NORM_MINMAX, CV_8UC1);
        break;
    case 3:
        cv::normalize(src, dst, 0, 255, NORM_MINMAX, CV_8UC3);
        break;
    default:
        src.copyTo(dst);
        break;
    }
    return dst;
}

// 将一副图像的数据转换为Row Matrix中的一行；这样做是为了跟opencv给出的PCA类的接口对应
//参数中最重要的就是第一个参数，表示的是训练图像样本集合
Mat asRowMatrix(const vector<Mat>& src, int rtype, double alpha = 1, double beta = 0) {
    // 样本个数
    size_t n = src.size();
    // 如果样本为空，返回空矩阵
    if(n == 0)
        return Mat();
    // 样本的维度
    size_t d = src[0].total();
    // 构建返回矩阵
    Mat data(n, d, rtype);
    // 将图像数据复制到结果矩阵中
    for(int i = 0; i < n; i++) {
        //如果数据为空，抛出异常
        if(src[i].empty()) {
            string error_message = format("Image number %d was empty, please check your input data.", i);
            CV_Error(CV_StsBadArg, error_message);
        }
        // 图像数据的维度要是d，保证可以复制到返回矩阵中
        if(src[i].total() != d) {
            string error_message = format("Wrong number of elements in matrix #%d! Expected %d was %d.", i, d, src[i].total());
            CV_Error(CV_StsBadArg, error_message);
        }
        // 获得返回矩阵中的当前行矩阵:
        Mat xi = data.row(i);
        // 将一副图像映射到返回矩阵的一行中:
        if(src[i].isContinuous()) {
            src[i].reshape(1, 1).convertTo(xi, rtype, alpha, beta);
        } else {
            src[i].clone().reshape(1, 1).convertTo(xi, rtype, alpha, beta);
        }
    }
    return data;
}

int main(int argc, const char *argv[]) {
    // 训练图像集合
    vector<Mat> db;

    // 本例中使用的是ORL人脸库，可以自行在网上下载
    //将数据读入到集合中

    db.push_back(imread("s1/1.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s1/2.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s1/3.pgm", IMREAD_GRAYSCALE));

    db.push_back(imread("s2/1.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s2/2.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s2/3.pgm", IMREAD_GRAYSCALE));

    db.push_back(imread("s3/1.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s3/2.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s3/3.pgm", IMREAD_GRAYSCALE));

    db.push_back(imread("s4/1.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s4/2.pgm", IMREAD_GRAYSCALE));
    db.push_back(imread("s4/3.pgm", IMREAD_GRAYSCALE));

    // 将训练数据读入到数据集合中，实现PCA类的接口
    Mat data = asRowMatrix(db, CV_32FC1);

    // PCA中设定的主成分的维度,这里我们设置为10维度
    int num_components = 10;

    // 构建一份PCA类
    PCA pca(data, Mat(), CV_PCA_DATA_AS_ROW, num_components);

    // 复制PCA方法获得的结果
    Mat mean = pca.mean.clone();
    Mat eigenvalues = pca.eigenvalues.clone();
    Mat eigenvectors = pca.eigenvectors.clone();

    // 平均脸:
    imshow("avg", norm_0_255(mean.reshape(1, db[0].rows)));

    // 前三个训练人物的特征脸
    imshow("pc1", norm_0_255(pca.eigenvectors.row(0)).reshape(1, db[0].rows));
    imshow("pc2", norm_0_255(pca.eigenvectors.row(1)).reshape(1, db[0].rows));
    imshow("pc3", norm_0_255(pca.eigenvectors.row(2)).reshape(1, db[0].rows));

    // Show the images:
    waitKey(0);

    // Success!
    return 0;
}

以上代码中主要用到的opencv函数介绍：

Mat Mat::reshape(int cn, int rows=0) const

　　opencv手册上的解释为：Changes the shape and/or the number of channels of a 2D matrix without copying the data.

参数cn：新的通道数；如果cn值为0表示变换前后通道数不变

参数rows：新的行数；如果rows值为0表示变换后矩阵的行数不变

该函数会为当前矩阵创建一个新的矩阵头（指针），新的矩阵拥有不同的尺寸或者不同的通道数，其优点在于运算复杂度为O（1），不用复制矩阵数据.正是因为不用复制数据，所以在转变过程中要保证原数据矩阵在数据上的连续性（这里的连续性是相对于原矩阵来说）为了更好的说明，举个例子：

std::vector<Point3f> vec;//一个3D数据点的集合
...
Mat pointMat = Mat(vec). // 将这个三维向量集合转换为矩阵，复制度为O（1）；实际上形成的矩阵为一个N*1的3通道图像阵
reshape(1). // 用reshape方法将其映射为N*3的1通道图像阵，同样运算复杂度为O（1）

boolMat::isContinuous() const

opencv手册上的解释：Reports whether the matrix is continuous or not.

如果矩阵元素相对于原始矩阵在元素存储上是连续的，行与行之间没有间隙，那么就返回true否则就返回false；很显然如果是1*1或者1*N矩阵，那么其返回值永远是true。这个矩阵的连续性比较晦涩，我们看下该方法的可替代方法的实现

// 替代 Mat::isContinuous()的方法
bool myCheckMatContinuity(const Mat& m)
{
return m.rows == 1 || m.step == m.cols * m.elemSize();//如果矩阵只有一行就不会出现行与行之间的间断；如果为多行，矩阵的步阶应该是列数*元素尺寸
}

void Mat::convertTo(OutputArray m, int rtype, double alpha=1, double beta=0 ) const

　　该函数其实是对原Mat的每一个值做一个线性变换。参数1为目的矩阵，参数2为目d矩阵的类型，参数3和4变换的系数，看完下面的公式就明白了：

PCA::PCA(InputArray data, InputArray mean, int flags, int maxComponents=0)

　　该构造函数的第一个参数为要进行PCA变换的输入Mat；参数2为该Mat的均值向量；参数3为输入矩阵数据的存储方式，如果其值为CV_PCA_DATA_AS_ROW则说明输入Mat的每一行代表一个样本，同理当其值为CV_PCA_DATA_AS_COL时，代表输入矩阵的每一列为一个样本；最后一个参数为该PCA计算时保留的最大主成分的个数。如果是缺省值，则表示所有的成分都保留。

Mat PCA::project(InputArray vec) const

　　该函数的作用是将输入数据vec(该数据是用来提取PCA特征的原始数据)投影到PCA主成分空间中去，返回每一个样本主成分特征组成的矩阵。因为经过PCA处理后，原始数据的维数降低了，因此原始数据集中的每一个样本的维数都变了，由改变后的样本集就组成了本函数的返回值。

Mat PCA::backProject(InputArray vec) const

　　一般调用backProject（）函数前需调用project()函数，因为backProject()函数的参数vec为经过PCA投影降维过后的矩阵。因此backProject()函数的作用就是用vec来重构原始数据集（关于该函数的本质数学实现暂时还不是很了解）。

　　另外PCA类中还有几个成员变量，mean,eigenvectors, eigenvalues等分别对应着原始数据的均值，协方差矩阵的特征值和特征向量。

获得的结果如下：

avrageface

EignFace

OK,我们已经可以获得ORL数据库中每个人物的PCA特征脸，下一步也是我们下一节要研究的就是用训练样本表示出测试样本，从而找到M近邻样本；

FROM: http://www.cnblogs.com/zcftech/archive/2013/04/13/3017411.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

视频opencv

翠竹林 Opencv+C++之人脸识别的相关文章

蓝桥杯成绩统计

目录问题描述思路分析及代码实现问题描述小蓝给学生们组织了一场考试卷面总分为 100 分每个学生的得分都是一个 0 到 100 的整数如果得分至少是 60 分则称为及格如果得分至少为 85 分则称为优秀请计算及格率和优秀
51单片机的串口通迅

通信的基本方式分为并行通信和串行通信并行通信数据的各位同时在多根数据线上发送或接收特点控制简单传输速度快由于输线较多长距离传送时成本高且接收方的各位同时接收存在困难串行通信使用一条数据线将数据一位一位的依次传输每一位数
1600*B. pSort（并查集）

解析并查集将能够交换的位置相连查看对应的位置能够交换 include
面试题： Vue中的 computed 和 watch的区别

computed computed看上去是方法但是实际上是计算属性它会根据你所依赖的数据动态显示新的计算结果计算结果会被缓存 computed的值在getter执行后是会缓存的只有在它依赖的属性值改变之后下一次获取computed
巧用 ChatGPT，让开发者的学习和工作更轻松

引言随着人工智能技术的快速发展和广泛应用 ChatGPT 作为一种新兴的自然语言处理模型近期备受瞩目引发了广泛讨论 ChatGPT 具有多种应用场景既可以用作聊天机器人实现智能问答和自然语言交互也可以作为文本生成工具帮助人们撰
html5中如何去掉input type date默认样式

html5中如何去掉input type date默认样式 1 时间选择的种类 HTML代码选择日期
【初探DETR】安装环境

windows下需要环境 cython git https github com cocodataset cocoapi git subdirectory PythonAPI egg pycocotools torch gt 1 5 0
C# 实例详解委托之Func、Action、delegate（精品）

概述委托是 NET编程的精髓之一在日常编程中经常用到在C 中实现委托主要有Func Action delegate三种方式本节主要就这三种委托的用法通过实例展开讲解 Func用法解析 Func Func是带返回值的委托原型函数如下
软件测试技术（性能与自动化测试）

一实验原理 1 功能与自动化测试功能自动化测试是指使用自动化工具和脚本来模拟用户操作验证软件应用程序的各种功能是否按照预期工作的过程在进行功能自动化测试时测试人员通常编写脚本这些脚本可以模拟用户在应用程序中进行的各种操作例如点
【机器学习】12、主题模型

文章目录一 pLSA 二 LDA模型一 pLSA 每个文档都会在主题上有一个分布每个主题在各个词上也有一个分布 p w j
React中使用if else 条件判断

在react中用jsx渲染dom的时候经常会遇到if条件判断然而在jsx中竟是不允许if条件判断的以下有几种判断方式可以根据自己的应用场景挑选适合的方案一 class HelloMessage extends React Comp
QTableWidget获取选中的内容及所在行数

QTableWidget选中所有单元格及取消选中所有单元格 ui gt allowSelectKeyTableWidget gt selectAll ui gt allowSelectKeyTableWidget gt setFocus i
使用 Blender* 重新拓扑 VR 和游戏素材

本文介绍如何将网格重新拓扑成一个整洁的低密度模型然后 UV 解包该网格以便将纹理贴添加至新模型本文还将探讨如何使用免费工具比如 Blender 及其 Bsurface 插件重新拓扑雕塑的 3D 网格查看详情
bootstrap3 表单构建器_如何快速构建基于MES的开源云平台

导读本文为2019工业互联网平台活动盘点文章同时也欢迎广大工业互联网平台企业参与本次盘点具体参与方式可加编辑微信号 13517202453 详细咨询随着智能制造转型战略的持续推进 MES作为承载智能化生产制造过程的核心系统正在受到越来
正则表达式语法大全

前言一般开发中都会接触到正则表达式作为一名合格的前端也应该了解一下正则表达式编写原则便于自己也能快速编写想要的正则表达式 1 作用正则表达式是一种字符串匹配的模式数据验证比如电话号码邮箱等替换文本快速找到特定文本用于替

随机推荐

lua秒级睡眠和毫秒级睡眠(sleep, msleep)

秒级睡眠 for linux cygwin or mingw function sleep n os execute sleep tonumber n end for windows function sleep n os execute
Transaction rolled back because it has been marked as rollback-only解决

项目中遇到Transaction rolled back because it has been marked as rollback only错误不要想就是遇到了事物嵌套即使你把所有方法上的 Transactional注解全部删除
cookie 设置中文

在使用Django的时候需要将中文用户名写入cookie中但是cookie的编码不支持中文写入就会 UnicodeEncodeError latin 1 codec can t encode characters in position
更好的在小学语课上用计算机,论多媒体技术在小学语文教学中的作用

论多媒体技术在小学语文教学中的优势作者孖无悔观教育论文格式范文摘要多媒体教学相比于传统的黑板加粉笔式的传统教学更具有优势多媒体教学在小学语文课堂中的应用犹如清风活水给教育注入了新的活力它不但可以优化课堂结构而且也让我们
java 匿名内部类简介说明

转自 java 匿名内部类简介说明下文笔者讲述Java匿名内部类的简介说明如下所示匿名内部类的简介匿名内部类未显式指定类名的内部类称之为匿名内部类匿名内部类创建匿名类是不能有名称的类所以没办法引用它们须在创建时作为ne
关于element UI 中输入框禁止输入空格的实现

关于element UI 中输入框禁止输入空格的实现在项目开发过程中会遇到输入框禁止输入空格或者特殊字符之类的需求其中禁止输入空格的实现方法如下所示 1 使用vue框架中的 trim修饰符
Python基础教程(crossin全60课)

Python 第第 1 1 课安装 4 Python 第第 2 2 课 print 5 Python 第第 3 3 课 IDE
Flutter踩坑笔记一——环境搭建的坑

Flutter的环境搭建其实还是很简单的当你把AndroidStudio升级安装3 5版本的时候他已经默认为你安装了Dart和Flutter插件可见Google对flutter的重视所以也省了我们不少事儿首先打开官方文档获取
mysql数据库中user表字段详解

描述 MySQL的user表是MySQL服务器的内置表它用于存储MySQL服务器上的用户信息包括用户名密码主机名和权限等它用于控制MySQL服务器上的访问权限以确保服务器的安全性表结构 CREATE TABLE user Ho
文本挖掘（四万字总结篇：爬虫 - 文本预处理 - 高频词统计 - 聚类 - 情感分析）

1 爬虫 1 1 爬虫原理这部分内容可以跳过掌握与否对后面内容的阅读影响并不大但有兴趣的话可以看看呐实现一个爬虫一般需要经过两个步骤处理请求和解析源码数据处理请求方面我们可以使用Python程序自动发送请求然后根据返回的
求助，AttributeError: ‘Namespace‘ object has no attribute ‘input_df_filename‘

import argparse import re import pandas as pd import os import json from pyxdameraulevenshtein import damerau levenshtei
【EasyExcel】模板填充批量导出，多文件以zip压缩包格式导出

使用阿里巴巴的 EasyExcel 填充 excel模板导出需要支持批量操作即一个模板循环导出多份在网上找了下其他大佬们的做法没有找到想要的很多都是要先生成excel文件再压缩导出但我不想这样做想直接通过文件流的方式直接
【计算机网络】湖科大微课堂笔记 p50-53 路由选择协议概述、路由信息协议RIP、开放最短路径优先OSPF、边界网关协议BGP的基本工作原理

文章目录路由选择协议概述小结路由信息协议RIP的基本工作原理小结一些例题开放最短路径优先OSPF的基本工作原理小结边界网关协议BGP的基本工作原理小结一些例题路由选择协议概述因特网采用分层次的路由选择协议域间路由选
二叉搜索树(BST的理论剖析+代码实现)

二叉搜索树 BST树文章目录二叉搜索树 BST树 1 二叉搜索树的概念 2 二叉搜索树的结构定义 2 1 二叉搜索树结点模板的定义 2 2 二叉搜索树类模板的定义 3 二叉搜索树的效率 4 二叉搜索树的默认成员函数实现 4 1 BST的
MapReduce作业状态一直为ACCEPTED解决过程

toc 今天在测试Hadoop文件压缩功能时在之前本地搭建的Hadoop集群上提交了一个MapReduce作业但是提交后发现一直卡在那不动 18 07 20 17 21 50 WARN util NativeCodeLoader Una
Swagget技术·SpringBoot继承Swagger框架详解！

文章目录一 Swagger简介二 SpringBoot集成Swagger 三配置Swagger 1 Swagger实例Bean是Docket 所以通过配置Docket实例来配置Swaggger 2 可以通过apiInfo 属性配置文档
基于电流采样运放的DCDC电源输出线损补偿电路的详细推导计算

基于电流采样运放的DCDC电源输出线损补偿电路的详细推导计算作者 TI 工程师 Kevin Zhang 当DCDC电源输出需要经过一根长线缆才能到达负载时由于线缆的阻抗产生压降会导致负载端电压小于实际DCDC输出电压为保证负载端电压
Markdown基本语法

Markdown基本语法一 Markdown了解二基本语法 1 各级标题的写法 2 段落 3 字体样式 4 分隔线 5 下划线 6 脚注 7 列表 8 代码块 9 引用 10 图片插入 11 链接 12 表格三高级技巧 1 HTM
Air Video

http baike baidu com view 8552809 htm 1 百度首页登录注册新闻网页贴吧知道MP3图片视频地图百科文库帮助首页自然文化地理历史生活社会艺术人物经济科技体育图片数字博物馆
翠竹林 Opencv+C++之人脸识别

最近一直在忙课程老师让我看看他的论文也没放在心上总算闲下来看了他在人脸识别方面的相关论文拿出一篇放在博客上跟大家共同分析下在看以下内容前首先要阅读下徐勇老师的这篇论文 A Two Phase Test Sample Sparse

翠竹林 Opencv+C++之人脸识别

翠竹林 Opencv+C++之人脸识别 的相关文章

随机推荐

热门标签

翠竹林 Opencv+C++之人脸识别的相关文章