深度学习之人脸检测实践-现有框架实现 opencv Face++

2023-11-17

人脸检测通常是人脸识别等复杂任务的第一步操作，目前主流的人脸检测算法：https://zhuanlan.zhihu.com/p/24816781。这里主要记录一些常用的算法实践，目前只有OpenCV提供的Haar级联检测和调用Face++的人脸检测接口，后续实践后会补充，相当于做个小小的积累。

1. OpenCV的Haar级联检测：
     安装OpenCV；
     下载人脸检测模型：
              我们将使用 OpenCV 中的 Haar feature-based cascade classifiers 来检测图像中的人脸。OpenCV 提供了很多预训练的人脸检测模型，它们以XML文件保存在 github。我们已经下载了其中一个检测模型，并且把它存储在 haarcascades 的目录中。

检测示例：

import cv2                
import matplotlib.pyplot as plt                        
%matplotlib inline                               
 
# 提取预训练的人脸检测模型
face_cascade = cv2.CascadeClassifier('haarcascades/haarcascade_frontalface_alt.xml')
 
# 加载彩色（通道顺序为BGR）图像
img = cv2.imread('images/9f510fb30f2442a70a9add3dd143ad4bd0130295.jpg')
 
# 将BGR图像进行灰度处理
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
 
# 在图像中找出脸
faces = face_cascade.detectMultiScale(gray)
 
# 打印图像中检测到的脸的个数
print('Number of faces detected:', len(faces))
 
print(type(faces))
 
# 获取每一个所检测到的脸的识别框
for (x,y,w,h) in faces:
    # 在人脸图像中绘制出识别框
    cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
    
# 将BGR图像转变为RGB图像以打印
cv_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
 
# 展示含有识别框的图像
plt.imshow(cv_rgb)
plt.show()

输出：

解释：

在使用任何一个检测模型之前，将图像转换为灰度图是常用过程。detectMultiScale 函数使用储存在 face_cascade 中的的数据，对输入的灰度图像进行分类。

在上方的代码中，faces 以 numpy 数组的形式，保存了识别到的面部信息。它其中每一行表示一个被检测到的脸，该数据包括如下四个信息：前两个元素 x、y 代表识别框左上角的 x 和 y 坐标（参照上图，注意 y 坐标的方向和我们默认的方向不同）；后两个元素代表识别框在 x 和 y 轴两个方向延伸的长度 w 和 d。

Haar 级联检测是一种合适的人脸检测技术，但是通过上面例子可以看出，它的准确率不够高，我们可以使用其他算法来提高检测的准确率，可以尝试HOG(Histograms of Oriented Gradients)或一些基于深度学习的算法，如YOLO(Real-Time Object Detection algorithm)、FaceNet、MTCNN等。此外，你可以使用[imgaug]来对训练集进行增强、扩充，以增加训练集中的多样性。

二、调用Face++的人脸检测API：
一、申请API AK：
地址：https://www.faceplusplus.com.cn/，注册账号之后，在应用管理处添加API KEY：

调用代码：


import requests
from json import JSONDecoder
 
http_url = "https://api-cn.faceplusplus.com/facepp/v3/detect"
key = "vsrZW9RPfVDo0L9n2uXUH718YBvIJcT-"
secret = "gHiWjCD9yh0XQjI7r2SEcdY8JBn14y9v"
filepath = "images/9f510fb30f2442a70a9add3dd143ad4bd0130295.jpg"
 
data = {"api_key": key, "api_secret": secret, "return_landmark": "1"}
files = {"image_file": open(filepath, "rb")}
response = requests.post(http_url, data=data, files=files)
 
req_con = response.content.decode('utf-8')
req_dict = JSONDecoder().decode(req_con)
 
faces = req_dict['faces']
print('Number of faces detected:', len(faces))
 
faceNum = len(faces)
print("识别到了%d个人脸"%(faceNum))
 
for i in range(faceNum):
    face_rectangle = faces[i]['face_rectangle']
    width =  face_rectangle['width']
    top =  face_rectangle['top']
    left =  face_rectangle['left']
    height =  face_rectangle['height']
    start = (left, top)
    end = (left+width, top+height)
    color = (55,255,155)
    thickness = 3
    cv2.rectangle(img, start, end, color, thickness)
# 将BGR图像转变为RGB图像以打印
cv_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
 
# 展示含有识别框的图像
plt.imshow(cv_rgb)
plt.show()

输出：

转：https://blog.csdn.net/qq_34464926/article/details/81185241

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习框架

机器学习工具

深度学习之人脸检测实践-现有框架实现 opencv Face++ 的相关文章

C++的基础学习

C 主要学习 C与C 的不同 C 的特性及专业术语 C 程序的编译一 C到C 的转换 C与C 的区别 C 是C的增强区别 C 具有严格的数据类型检查 C 新增了命名空间异常处理面向对象编程变量的权限和引用及函数的重载及运算符的重载
HTTP1.0和HTTP1.1和HTTP2.0的区别

HTTP1 0和HTTP1 1和HTTP2 0的区别 1 HTTP1 0和HTTP1 1的区别 1 1 长连接 Persistent Connection HTTP1 1支持长连接和请求的流水线处理在一个TCP连接上可以传送多个HTTP请
Mysql索引详解及优化(key和index区别)

Mysql索引详解及优化 key和index区别文章记录
Hyperledger Fabric配置文件解析

目录 1 相关配置文件介绍 2 crypto config yaml 3 configtx yaml 3 1 Organizations组织配置部分 3 2 Capabilities通道能力配置部分 3 3 Application 应用通道
浏览器内核css前缀大全

1 css前缀为 moz 的浏览器火狐浏览器 2 css前缀为 webkit 的浏览器谷歌浏览器苹果浏览器 Comodo Drangon 科摩多龙搜狗高速浏览器快快浏览器枫树浏览器云游浏览器 360极速浏览器世界之窗极速版
RedmiBook 蓝屏关机后出现 No Bootable Devices 问题的解决方法

问题关机后重新开机出现显示没有可启用设备解决方法一该方法解决的不够彻底暂时可以解决问题正常开机关机后按f2 开机键出现以下页面选择启动菜单 gt 启动模式 gt UEFI 启动 gt Enter 选择退出菜单 g
嵌入式毕业设计树莓派寝室宿舍门禁刷卡系统 - 物联网单片机嵌入式

文章目录 0 前言 1 前言 2 主要器件 3 实物效果 4 树莓派读取 RC522 RFID 标签 5 mg90s 控制原理 6 最后 0 前言这两年开始毕业设计和毕业答辩的要求和难度不断提升传统的毕设题目缺少创新和亮点往往达不到毕
为什么使用非线性激活函数？常见的非线性激活函数及优缺点对比

为何使用非线性激活函数如上图的神经网络在正向传播过程中若使用线性激活函数恒等激励函数即令则隐藏层的输出为即可以看到使用线性激活函数神经网络只是把输入线性组合再输出所以当有很多隐藏层时在隐藏层使用线性激活函数的训练效果和不
js实现滑动拼图验证码

js实现滑动拼图验证码我这个样式是仿那些大网站做了学习用的只用到前端无后端内容想改成后端的思路大概就是后端切割图片然后把图片传给前端前端展示前端完成拖拽后将坐标传回给后端后端去判断与自己切割的地方是否一致下面看图示
C++57个入门知识点_47 虚函数的多态性（成员函数中的虚函数具有多态性；构造和析构函数中，虚函数没有多态性；在构造析构函数中调用普通成员函数，该普通成员函数中有虚函数的间接调用，没有多态）

本篇主要讨论两个问题 1 成员函数中虚函数是否有多态性答案为有 2 构造和析构函数中虚函数是否有多态性答案为无 1 成员函数中虚函数是否有多态性成员函数中的虚函数具有多态性以下代码中 void test foo 普通成员函
#手写代码# 用Bert+CNN解决文本分类问题

文章目录 1 配置文件 2 定义模型 2 1 init self config 函数 2 1 conv and pool 函数 2 3 forward self x 函数 1 配置文件首先定义一个配置文件类类里边存放Bert和CNN的一
Web函数请求多并发上线，Web服务部署更快更省

Web函数 Web Function 是云函数的一种函数类型区别于事件函数 Event Function Web函数通过支持原生的HTTP WebSocket协议兼容任意一种原生Web框架编写的Web服务无需改造即可将传统项目部署到函
七大经典排序算法总结【详解】

排序算法的分类插入排序选择排序交换排序归并排序具体分类如图所示这七种排序算法在我们生活中应用非常广泛所用的场景各有不同他的时间复杂度和空间复杂度也是不同的一插入排序初始数据越接近有序时间效率越高 1 直接插入排序直
【毕设教程】基于python实现网络爬虫

文章目录 0 前言 1 简介 2 交互界面 3 爬虫部分 4 数据存储 5 最后 0 前言 Hi 大家好这里是丹成学长的毕设系列文章对毕设有任何疑问都可以问学长哦这两年开始各个学校对毕设的要求越来越高难度也越来越大毕业设计耗费时
Linux系统安装python3.8与卸载教程

Linux系统安装python3 8与卸载教程一安装python解释器 1 获取系统版本信息首先查看Linux系统版本信息 root oldboy cat proc version Linux version 4 18 0 240
python三行代码生成自己专属二维码

利用pip安装库MyQR库 pip install MyQR 代码 from MyQR import myqr myqr run words https blog csdn net qq 29023939 spm 1001 2014 300

随机推荐

el-table多选框点击表格选中和取消

div div
在 Python 中使用 OpenAI 的新 Whisper API 进行语音转文本

您是否厌倦了手动转录数小时的录音您想节省时间并提高工作效率吗然后您会很高兴听到 OpenAI 用于语音到文本转换的新 Whisper API 借助这项尖端的 AI 技术您现在可以在 Python 程序中轻松地将音频文件转换为文本让
【Transformer】Self-Attention with Relative Position Representations及实现pytorch代码

在Transformer中加入可训练的embedding编码使得output representation可以表征inputs的时序位置信息这些embedding vectors在计算输入序列中的任意两个单词i j之间的key和val
深入浅出主流的几款小程序跨端框架原理

目前小程序在用户规模及商业化方面都取得了极大的成功微信支付宝百度字节跳动等平台的小程序日活都超过了3亿我们在开发小程序时仍然存在诸多痛点小程序孱弱简陋的原生开发体验注定会出现小程序增强型框架来提升开发者开发体验各家厂商小
全链路Python环境迁移

全链路Python环境迁移在当前的Python环境中安装一些库以后如果换了一套Python环境难道再来一次不停的pip install 当然不是第一步使用pip freeze 冻结备份当前Python库的环境 pip free
linux环境配置以后生效,Linux中修改环境变量及生效方法

Linux中修改环境变量及生效方法在 etc profile文件中添加变量对所有用户生效永久的用VI在文件 etc profile文件中增加变量该变量将会对Linux下所有用户有效并且是永久的要让刚才的修改马上生效需要执行
专门为码农朋友量身打造的笔记软件-Boostnote

感谢参考原文 http bjbsair com 2020 04 01 tech info 18432 html 前言很多人好奇程序猿是如何记笔记的如果有了解过可能会知道 Markdown 都知道Markdown 是一个轻量级的标记语言
Unity插件DlibFaceLandmarkDetector的使用心得

Unity小白日记 1 DlibFaceLandmarkDetector Unity官方插件在插件商店里即可找到但是对于我这种只是用来试用一下效果的小白来说还是有点小贵更别说还是美刀如果如果有感兴趣的童鞋可以在CSDN查找下载学习
Python：variable in function（argument、function） name should be lowercase 处理方式

用pyCharm时常会出现警告信息 function name should be lowercase 函数名应该是小写字母 argument name should be lowercase 参数名应该是小写字母 variable i
检查电脑显卡配置是否支持CUDA

计算机管理系统工具设备管理器显示适配器 https developer nvidia com cuda gpus
SpringMVC：从入门到精通，7篇系列篇带你全面掌握--五.JSR303和拦截器

Welcome Huihui s Code World 接下来看看由辉辉所写的关于SpringMVC的相关操作吧目录 Welcome Huihui s Code World 一 JSR303是什么二使用JSR303的优势三使用JS
台式计算机无线接收,台式电脑无线接收器插上连不上网怎么处理

大家好我是时间财富网智能客服时间君上述问题将由我为大家进行解答台式电脑无线接收器插上连不上网的处理方方法 1 首先您将您的无线网接收器插入到您的台式机中 2 接下来您看看有没有反应是否可以接收到wifi 如果没有找到那么它需要
jsp 生成静态页面

file name 文件名及文件之后的参数最好为a jsf fileId aaaa path 文件所在的路径相对于根目录而言的 realName文件要保存的名字 realPath文件要保存的真实路径默认与文件所在的目录相同 publi
学生正版Altium Designer许可证到期怎么再申请

学生如何使用正版Altium Designer软件适用于老师学生校友等等目录一前情提要二许可证延期步骤 2 1 重要前提 2 2 许可证申请 2 3 申请完成一前情提要如果不知道怎么安装学生版AD 可点击以下链接学生如
Azure简单使用教程

这段时间在做调研我们小组负责了解微软的Azure的情况按照官网教程我搭建了一遍官网示例汽车价格预测过程如下一创建模型 1 获取数据若要进行机器学习首先需获取数据可以使用机器学习工作室随附的多个示例数据集也可以从多种源导
什么是稀疏数组？

文章目录稀疏数组一定义二代码实现 1 二维数组转稀疏数组 2 稀疏数组转二维数组 3 完整代码总结稀疏数组稀疏数组一般使用在一个二维数组存储着大量无效数据的场景中举个例子一个二维数组存储了100个数据有效数据只有2个
【Qt】Qt中的拖放操作实现——拖放文件以及自定义拖放操作

文章目录 Qt的拖放操作使用拖放打开文件自定义拖放操作文章参考 Qt Creator快速入门第三版 Qt的拖放操作拖放操作分为拖动Drag和放下Drop Qt提供了强大的拖放机制可在帮助文档中通过Drag and Drop关键字
IAR Embedded Workbench安装

1 开发环境安装包链接 https pan baidu com s 1Eatz6vyuniWRcAHd OMWcA 2 安装步骤
JS做图片滑动

在界面中做一个关于图片左右滑动的效果循环切换可从最后一张右滑到第一张从第一张左滑到最后一张设置两个按钮 a href lt a a href gt a 图片 img js代码获取id 把图片放入一个数组设定初始函数图片显示为数
深度学习之人脸检测实践-现有框架实现 opencv Face++

人脸检测通常是人脸识别等复杂任务的第一步操作目前主流的人脸检测算法 https zhuanlan zhihu com p 24816781 这里主要记录一些常用的算法实践目前只有OpenCV提供的Haar级联检测和调用Face 的人脸检

深度学习之人脸检测实践-现有框架实现 opencv Face++

输出：

深度学习之人脸检测实践-现有框架实现 opencv Face++ 的相关文章

随机推荐

热门标签