将CelebA数据集所给标签转化为MTCNN中训练集所需标签

2023-11-14

img_dir = r"D:\datasets\CelebA\Img\img_celeba.7z\img_celeba"
anno_src = r"D:\datasets\CelebA\Anno\list_bbox_celeba.txt"
anno_landmarks_src = r"D:\datasets\CelebA\Anno\list_landmarks_celeba.txt"
save_dir = r".\test_data\MTCNN"

先看一下我们需要处理的数据集从哪里调用的

r"D:\datasets\CelebA\Img\img_celeba.7z\img_celeba"：这个数据集中是人脸头像所在的所有的野生图像（人脸所处位置不一，图片shape不一）
r"D:\datasets\CelebA\Anno\list_bbox_celeba.txt"：在野生图像上人脸所处的目标框的坐标（左上角横纵坐标和宽高）
r"D:\datasets\CelebA\Anno\list_landmarks_celeba.txt"：在野生图像上人脸五个关键点所处的横纵坐标

以上的三种信息都可以通过labelme来直接标注。

def gen_sample(face_size, stop_value):
    # 创建保存样本的目录
    positive_img_dir = os.path.join(save_dir, str(face_size), "positive")
    negative_img_dir = os.path.join(save_dir, str(face_size), "negative")
    part_img_dir = os.path.join(save_dir, str(face_size), "part")
    for dir_path in [positive_img_dir, negative_img_dir, part_img_dir]:
        if not os.path.exists(dir_path):
            os.makedirs(dir_path)

faca_size用来规定我们从野生图片中截取多大的图片，有12,24,48的选择，stop_value表示我们截取的图片的张数，也就是我们输入到PRO网络中需要数据集的个数，由于三个网络都是独立的，所以数量可以不一样。

我们假设目前我们创建的是24大小的训练数据集，首先创建了三个文件夹，分别用来存放24大小的正样本，负样本，偏样本。

    # 创建保存标签的文件，并打开文件
    anno_positive_filename = os.path.join(save_dir, str(face_size), "positive.txt")
    anno_negative_filename = os.path.join(save_dir, str(face_size), "negative.txt")
    anno_part_filename = os.path.join(save_dir, str(face_size), "part.txt")

创建三个txt文件，用来保存我们24大小的图片下正负样本的标签（至于有哪些标签待会儿再说）

    try:
        with open(anno_landmarks_src) as f:
            landmarks_list = f.readlines()

        # 读取CelebA的标签文件
        with open(anno_src) as f:
            anno_list = f.readlines()

		        # 样本计数
        positive_count = 0
        negative_count = 0
        part_count = 0

打开野生数据集的目标框和关键点坐标文件，按照每一行为单位打开

        # 开打人脸框的标签，循环读取每一行
        for i, (anno_line, landmarks) in enumerate(zip(anno_list, landmarks_list)):

            # 跳过表头
            if i < 2:
                continue

anno_list和landmarks_list分别表示在野生图片下脸所在的目标框坐标和关键点坐标，利用zip来输出同一张野生图片的目标框坐标和关键点坐标

表头是一些说明性文字,有效的目标框坐标和关键点坐标的形式如下：↓

'''
000001.jpg    95  71 226 313
000002.jpg    72  94 221 306
'''

'''
000001.jpg 165  184  244  176  196  249  194  271  266  260
000002.jpg 140  204  220  204  168  254  146  289  226  289
'''

            # 5个关键点
            landmarks = landmarks.split()
            # 定位框
            strs = anno_line.split()
            # 解析文件名字
            img_name = strs[0].strip()
            # 读取图像
            img = Image.open(os.path.join(img_dir, img_name))
            # 解析出宽度和高度
            img_w, img_h = img.size

将二者全部用空格隔开

拿出该图片的名称img_name

利用img_name读取该野生图片的像素信息img

由于我们使用的Image读取图片，所以img是一个[h,w,3]的ndarray数组，利用.size来得到该野生图片的宽高以便于后面的归一化

            # 转换框坐标的类型
            x, y, w, h = float(strs[1].strip()), float(strs[2].strip()), float(strs[3].strip()), float(strs[4].strip())

            # 标签矫正
            x1 = int(x + w * 0.12)
            y1 = int(y + h * 0.1)
            x2 = int(x + w * 0.9)
            y2 = int(y + h * 0.85)

将定位框的左上横纵坐标和宽高提取出来，转成浮点类型（再一次证明就算是给定的标签，它的数据也确实是字符串类型）

然后计算出该目标框的左上和右下的坐标（这里做了一个标签的矫正，相当于目标框往中心位置靠拢然后缩小了，换句话说目标框里面尽可能地只充满脸）

            # 计算新的宽度和高度
            w, h = x2 - x1, y2 - y1
            
            # 判断坐标是否符合要求
            if max(w, h) < 40 or x1 < 0 or x2 < 0 or y1 < 0 or y2 < 0:
                continue
            
            box = [x1, y1, x2, y2]

然后计算新的目标框的宽高。同时判断，如果过滤掉标注错误的图像，并且规定宽高至少有一个不能小于40，换句话说脸的范围不能太小了，我个人认为这个40只是一个自定义的数字，可以自己更改。

由此，我们就获得了目标框修正后在野生图像上的左上和右下的坐标（未归一化）

            # 求出中心点和边长，偏移中心点和边长得到样本，每张图偏移5次
            cx = x1 + w / 2
            cy = y1 + h / 2

            # 最大边长
            max_side = max(w, h)

找到每个目标框中心点所在的坐标，并计算该目标宽高的最大值，以备后面制作正负样本，偏样本做准备。↑

            # 记录5个关键点的坐标
            px1 = float(landmarks[1].strip())
            py1 = float(landmarks[2].strip())
            px2 = float(landmarks[3].strip())
            py2 = float(landmarks[4].strip())
            px3 = float(landmarks[5].strip())
            py3 = float(landmarks[6].strip())
            px4 = float(landmarks[7].strip())
            py4 = float(landmarks[8].strip())
            px5 = float(landmarks[9].strip())
            py5 = float(landmarks[10].strip())

得到该图片下关键点的位置坐标，准备进入样本的制作↑

	float_num = [0.1, 0.1, 0.3, 0.5, 0.95, 0.95, 0.99, 0.99, 0.99, 0.99]
	
            for _ in range(5):

                # 随机偏移中心点坐标以及边长
                seed = float_num[np.random.randint(0, len(float_num))]
                
                # 中心点x坐标随机偏移
                _cx = cx + np.random.randint(int(-cx * seed), int(cx * seed))
                # 中心点y坐标随机偏移
                _cy = cy + np.random.randint(int(-cy * seed), int(cy * seed))
                # 最大边长随机偏移
                _max_side = max_side + np.random.randint(int(-max_side * seed), int(max_side * seed))

从fload_num中随机选择一个偏移种子seed，seed的范围是0到1双开区间

先看看中心点偏移的特点，以x为例：int(-cx * seed), int(cx * seed)在(-cx,cx)之间，那么_cx的范围就在(0,2cx)之间，y同理。
同时偏移后的目标框的长度也需要重新规定范围，其范围在(0,2max_size)之间。

                # 得到偏移后的坐标值（方框）
                _x1 = _cx - _max_side / 2
                _y1 = _cy - _max_side / 2
                _x2 = _x1 + _max_side
                _y2 = _y1 + _max_side

                # 偏移过大，偏出图像了，此时，不能用，应该再次尝试偏移
                if _x1 < 0 or _y1 < 0 or _x2 > img_w or _y2 > img_h:
                    continue

利用偏移后的要素得到偏移后的目标框所在的左上和右下的下标（此时偏移后的目标框被强制转换成了方形，也就是等宽等高）。

                # 偏移过大，偏出图像了，此时，不能用，应该再次尝试偏移
                if _x1 < 0 or _y1 < 0 or _x2 > img_w or _y2 > img_h:
                    continue

                # 记录偏移后的坐标
                cbox = [_x1, _y1, _x2, _y2]

如果偏移后的左上角坐标在0以下，或者右下角坐标超出了野生图片的宽高范围，那么就停止本次循环，重新再随机挑选一个种子进行偏移

满足条件之后记录下偏移框在野生图像上的左上角和右下角坐标

                # --------------
                offset_x1 = (x1 - _x1) / _max_side
                offset_y1 = (y1 - _y1) / _max_side
                offset_x2 = (x2 - _x2) / _max_side
                offset_y2 = (y2 - _y2) / _max_side

                # 计算两个坐标点和5个关键点的偏移率
                offset_px1 = (px1 - _x1) / _max_side
                offset_py1 = (py1 - _y1) / _max_side
                offset_px2 = (px2 - _x1) / _max_side
                offset_py2 = (py2 - _y1) / _max_side
                offset_px3 = (px3 - _x1) / _max_side
                offset_py3 = (py3 - _y1) / _max_side
                offset_px4 = (px4 - _x1) / _max_side
                offset_py4 = (py4 - _y1) / _max_side
                offset_px5 = (px5 - _x1) / _max_side
                offset_py5 = (py5 - _y1) / _max_side

上面是这个网络的重中之重。上面的14个数就是我们要输入到网络中的确定边框位置的四要素和确定五个关键点坐标的偏移率（终于现身了）

                # 根据偏移后的坐标截图图片，并缩放成要训练的大小
                img_crop = img.crop(cbox)
                img_crop = img_crop.resize((face_size, face_size))

将偏移框里面的内容从图片中截出来，然后resize成指定的大小，由于偏移框内本来就是方形的，所以resize图片并不会出现失真。

                # 对偏移框和真实框做iou, 根据偏离程度划分样本
                iou = tool.iou(box, np.array([cbox]))[0]
                if iou > 0.7:
                    img_crop.save(os.path.join(positive_img_dir, "{0}.jpg".format(positive_count)))
                    anno_positive_file.write(
                        "positive/{0}.jpg {1} {2} {3} {4} {5} {6} {7} {8} {9} {10} {11} {12} {13} {14} {15}\n".format(
                            positive_count, 1,
                            offset_x1, offset_y1, offset_x2, offset_y2, offset_px1, offset_py1, offset_px2, offset_py2,
                            offset_px3, offset_py3, offset_px4, offset_py4, offset_px5, offset_py5))
                    anno_positive_file.flush()
                    positive_count += 1

然后计算该偏移框与真实目标框之间的iou，如果大于0.7则认为偏移框里面的是正样本，并且将该偏移框的信息填写进positive.txt里面

                elif 0.4 < iou < 0.6:
                    img_crop.save(os.path.join(part_img_dir, "{0}.jpg".format(part_count)))
                    anno_part_file.write(
                        "part/{0}.jpg {1} {2} {3} {4} {5} {6} {7} {8} {9} {10} {11} {12} {13} {14} {15}\n".format(
                            part_count, 2,
                            offset_x1, offset_y1, offset_x2, offset_y2, offset_px1, offset_py1, offset_px2, offset_py2,
                            offset_px3, offset_py3, offset_px4, offset_py4, offset_px5, offset_py5))
                    anno_part_file.flush()
                    part_count += 1
                elif iou < 0.2:
                    img_crop.save(os.path.join(negative_img_dir, "{0}.jpg".format(negative_count)))
                    anno_negative_file.write("negative/{0}.jpg 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0\n".format(negative_count))
                    anno_negative_file.flush()
                    negative_count += 1
            count = positive_count + negative_count + part_count
            if count > stop_value:
                break

如果iou在0.4和0.6之间，则认为是偏样本，小于0.2则认为是负样本，依次将这些偏移框的信心填写进对应的文本中就可以了。

这里还有一个细节，也就是seed是从：

float_num = [0.1, 0.1, 0.3, 0.5, 0.95, 0.95, 0.99, 0.99, 0.99, 0.99]

其中0.1对应的正样本实现的方式，0.3和0.5对应偏样本实现的方式，0.95和0.99对应负样本实现的方式，也就是说最后形成的指定大小的训练集图片中，正样本，偏样本，负样本之间的比值是[1,1,3].

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将CelebA数据集所给标签转化为MTCNN中训练集所需标签的相关文章

ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
无法使用 BeautifulSoup 和 Requests 抓取下拉菜单

我想抓取百年灵网站上的产品页面以获取各种信息示例页面 https www breitling com gb en watches navitimer b01 chronograph 46 AB0127211C1A1 https www b
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
为什么 __instancecheck__ 没有被调用？

我有以下 python3 代码 class BaseTypeClass type def new cls name bases namespace kwd result type new cls name bases namespace p
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers

随机推荐

松灵机器人——ROS下的CAN通讯调试（内含所需调用包，都是操作步骤）

松灵机器人 ROS下的CAN通讯调试 1 代码包地址 2 硬件准备 2 1 SCOUT MINI 小白车尾部航空插头 CAN TO USB适配器 2 2 接线 3 具体操作 3 1 ROS安装和环境设置 3 2 配置 CAN TO USB
ubuntu20.04安装以及后续配置

1 Ubuntu安装过程中如何分区比较复杂的方案安装时如果遇到关于boot的错误提示框使用如下方法解决 win 10 U盘启动安装ubuntu遇到的问题和解决方式预装win8的电脑上U盘安装ubuntu出现了问题比较简洁的分区方案
设计模式--observer观察者模式

转自 http blog csdn net Venlin article details 1658821 一观察者 Observer 模式观察者模式又叫做发布订阅 Publish Subscribe 模式模型视图 Model Vi
JMETER链接数据库（保姆级教学）

第一步下载mysql connector java 5 1 44 bin jar插件 RUL https www mysql com cn products connector 点击 Download 点击 Archives 选择版本后
开发完成的golang项目如何上线部署到Linu服务器上？

windows服务器先本地编译 go build main go 编译后会在同级目录生成可执行文件 main exe linux服务器方法一服务器上去编译安装go 配置GOPATH 1 把服务器上配置成本地一样的环境 2 包括项目里
【Shell案例】【打印指定行用sed、for循环、head和tail配合使用】4、输出第5行的内容...

描述写一个 bash脚本以输出一个文本文件 nowcoder txt 中第5行的内容示例假设 nowcoder txt 内容如下 welcometonowcoderthisisshellcode 你的脚本应当输出 is 方法1 变量定义
android源码编译错误：ninja failed with: signal: killed

原因是内存不够解决方法更换大内存条编译时关闭占内存的应用开启或者扩大swap分区 free m 查看swap分区大小 dd if dev zero of var swap bs 1024 count 2000000 2000000为
Linux OOM机制&线上osd异常kill

一引言某日早上收到邮件告警信息上报pg stale以及recovery信息于是登录系统运维二排查解决登录系统后发现系统已恢复正常按照正常来讲并无影响但系统既已出现recovery信息意味着一定有osd down发生于是
2023-9-10 集合-Nim游戏

题目链接集合 Nim游戏 include
uniapp体验如何？uniapp开发感受及优缺点分析

很多开发者在没有入坑uniapp之前都想知道uniapp的体验到底怎么样开发爽不爽优缺点是怎么样的坑多不多今天就以我个人开发的项目来谈一谈首先介绍一下我在公司开发的项目购靓号APP 也有h5 购靓号小程序扫描下方二维码可以快
华为OD机试 - 矩形相交的面积 - 逻辑分析（Java 2023 B卷 100分）

目录专栏导读一题目描述二输入描述三输出描述 1 输入 2 输出 3 说明四解题思路五 Java算法源码六效果展示 1 输入 2 输出 3 说明华为OD机试 2023B卷题库疯狂收录中刷题点这里专栏导读本专栏收
在HTML页面加载完毕后运行某个js.

js方法以下为jQuery方法需要引用jQuery文件或者其简写 function
CSDN删除、修改分类标签

点击头像进入管理博客点击个人分类管理就可以修改分类标签备注删除标签后该标签下的文章还在不会丢失
LeetCode Number Complement

class Solution public int findComplement int num int temp i 1 j temp num while temp 0 temp 2 i 2 j i 1 num return j temp
部分选主元matlab,列选主元的高斯消去法-matlab

大家对高斯消去法应该比较了解了高代和线性代数中做的已经不少了但是计算机实现的时候还是要注意一些东西列选主元的高斯消去法 function X lufact my A B Inpiut A 是系数矩阵 B是右端项 Output x是解
三层网络结构（核心层、汇聚层、接入层）

三层网络架构设计的网络有三个层次核心层网络的高速交换汇聚层提供基于策略的连接接入层将工作站接入网络核心层在核心层应该采用高带宽的交换机核心层的设备采用双机冗余热备份是非常必要的也可以使用负载均衡功能来改善网络性能对于网
软件测试复习（5）----基本路径测试中的细节

在做基本路径测试的题中又有了新的发现希望大家可以注意另外如果你是第一次看可以先看一下我之前讲的基本路径方法的步骤先看一下题目我们不讲如何做这道题只是讲一下我通过这道题关于知识点新的理解题目答案知识点细节逻辑与逻辑或
雪崩击穿/齐纳击穿

雪崩击穿发生在掺杂浓度较低自由电子冲撞价离子温度越高雪崩击穿需要的击穿电压越高齐纳击穿发生在掺杂浓度比较高的时候自由电子直接跳出共价键温度越高齐纳击穿需要的击穿电压越低
适用于小白-vs2019的下载与安装

学习c语言时少不了编译器的使用那么传统的dev c 过于古老的同时也不再更新而大学授课老师一般要求安装vc 6 0 学校机房也一般为vc 6 0 但这两种都还是过于古老现在机构授课过程一般采用vs2019 使用起来更加便捷清晰
将CelebA数据集所给标签转化为MTCNN中训练集所需标签

img dir r D datasets CelebA Img img celeba 7z img celeba anno src r D datasets CelebA Anno list bbox celeba txt anno lan

将CelebA数据集所给标签转化为MTCNN中训练集所需标签

将CelebA数据集所给标签转化为MTCNN中训练集所需标签 的相关文章

随机推荐

热门标签

将CelebA数据集所给标签转化为MTCNN中训练集所需标签的相关文章