yolov5标签数据增强脚本

2023-05-16

此代码用于将标注好的图片及其标签进行数据增强，优点在于不需要重新打标签

import xml.etree.ElementTree as ET
import os
import numpy as np
from PIL import Image
import shutil
import imgaug as ia
from imgaug import augmenters as iaa
from tqdm import tqdm


def read_xml_annotation(root, image_id):
    in_file = open(os.path.join(root, image_id), encoding='UTF-8')
    # print(in_file)
    tree = ET.parse(in_file)
    root = tree.getroot()
    bndboxlist = []

    for object in root.findall('object'):  # 找到root节点下的所有country节点
        bndbox = object.find('bndbox')  # 子节点下节点rank的值

        xmin = int(bndbox.find('xmin').text)
        xmax = int(bndbox.find('xmax').text)
        ymin = int(bndbox.find('ymin').text)
        ymax = int(bndbox.find('ymax').text)
        # print(xmin,ymin,xmax,ymax)
        bndboxlist.append([xmin, ymin, xmax, ymax])
        # print(bndboxlist)

    # ndbox = root.find('object').find('bndbox')
    return bndboxlist



def change_xml_list_annotation(root, image_id, new_target, saveroot, xml_id):
    save_path = os.path.join(saveroot, xml_id)
    in_file = open(os.path.join(root, str(image_id) + '.xml'), encoding='UTF-8')  # 这里root分别由两个意思
    tree = ET.parse(in_file)
    elem = tree.find('filename')
    elem.text = xml_id + img_type
    xmlroot = tree.getroot()
    index = 0

    for object in xmlroot.findall('object'):  # 找到root节点下的所有country节点
        bndbox = object.find('bndbox')  # 子节点下节点rank的值

        new_xmin = new_target[index][0]
        new_ymin = new_target[index][1]
        new_xmax = new_target[index][2]
        new_ymax = new_target[index][3]

        xmin = bndbox.find('xmin')
        xmin.text = str(new_xmin)
        ymin = bndbox.find('ymin')
        ymin.text = str(new_ymin)
        xmax = bndbox.find('xmax')
        xmax.text = str(new_xmax)
        ymax = bndbox.find('ymax')
        ymax.text = str(new_ymax)

        index += 1

    tree.write(save_path + '.xml')


def simple_example(AUGLOOP,IMG_DIR,XML_DIR,AUG_IMG_DIR,AUG_XML_DIR):
    boxes_img_aug_list = []
    new_bndbox_list = []
    new_name = None

    for root, sub_folders, files in os.walk(XML_DIR):
        for name in tqdm(files):
            bndbox = read_xml_annotation(XML_DIR, name)
            shutil.copy(os.path.join(XML_DIR, name), AUG_XML_DIR)
            try:
                shutil.copy(os.path.join(IMG_DIR, name[:-4] + img_type), AUG_IMG_DIR)
            except:
                shutil.copy(os.path.join(IMG_DIR, name[:-4] + '.JPG'), AUG_IMG_DIR)
            # print(os.path.join(IMG_DIR, name[:-4] + img_type))

            for epoch in range(1, AUGLOOP + 1):
                # 增强
                if epoch == 1:
                    seq = iaa.Sequential([
                        ####0.75-1.5随机数值为alpha，对图像进行对比度增强，该alpha应用于每个通道
                        iaa.ContrastNormalization((0.75, 1.5), per_channel=True),
                    ])
                elif epoch == 2:
                    seq = iaa.Sequential([
                        #### loc 噪声均值，scale噪声方差，50%的概率，对图片进行添加白噪声并应用于每个通道
                        iaa.AdditiveGaussianNoise(loc=0, scale=(0.0, 0.1 * 255), per_channel=0.75),
                    ])
                elif epoch == 3:
                    seq = iaa.Sequential([
                        iaa.Fliplr(1),  # 水平镜像翻转
                    ])
                # else:
                #     seq = iaa.Sequential([
                #         iaa.OneOf([iaa.Affine(rotate=90),
                #                    iaa.Affine(rotate=90),
                #                    iaa.Affine(rotate=270),
                #                    iaa.Affine(rotate=180),
                #                    iaa.Affine(rotate=180),
                #                    iaa.Affine(rotate=270)])
                #     ])
                seq_det = seq.to_deterministic()  # 保持坐标和图像同步改变，而不是随机
                # 读取图片
                try:
                    img = Image.open(os.path.join(IMG_DIR, name[:-4] + img_type))
                except:
                    img = Image.open(os.path.join(IMG_DIR, name[:-4] + '.JPG'))

                # JPG不支持alpha透明度，有可能报RGBA错误，将图片丢弃透明度转成RGB
                img = img.convert('RGB')
                # sp = img.size
                img = np.asarray(img)
                # bndbox 坐标增强
                for i in range(len(bndbox)):
                    bbs = ia.BoundingBoxesOnImage([
                        ia.BoundingBox(x1=bndbox[i][0], y1=bndbox[i][1], x2=bndbox[i][2], y2=bndbox[i][3]),
                    ], shape=img.shape)

                    bbs_aug = seq_det.augment_bounding_boxes([bbs])[0]
                    boxes_img_aug_list.append(bbs_aug)

                    # new_bndbox_list:[[x1,y1,x2,y2],...[],[]]
                    n_x1 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x1)))
                    n_y1 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y1)))
                    n_x2 = int(max(1, min(img.shape[1], bbs_aug.bounding_boxes[0].x2)))
                    n_y2 = int(max(1, min(img.shape[0], bbs_aug.bounding_boxes[0].y2)))
                    if n_x1 == 1 and n_x1 == n_x2:
                        n_x2 += 1
                    if n_y1 == 1 and n_y2 == n_y1:
                        n_y2 += 1
                    if n_x1 >= n_x2 or n_y1 >= n_y2:
                        print('error', name)
                    new_bndbox_list.append([n_x1, n_y1, n_x2, n_y2])

                    # 存储变化后的图片
                    image_aug = seq_det.augment_images([img])[0]
                    # 新文件名
                    new_name = name[:-4] + '-' + str(epoch)
                    path = os.path.join(AUG_IMG_DIR, new_name + img_type)

                    image_auged = bbs.draw_on_image(image_aug, thickness=0)
                    Image.fromarray(image_auged).save(path)

                # 存储变化后的XML
                change_xml_list_annotation(XML_DIR, name[:-4], new_bndbox_list, AUG_XML_DIR, new_name)
                new_bndbox_list = []


if __name__ == "__main__":

    # 随机种子
    ia.seed(1)
    img_type = '.jpg'
    # img_type = '.png'

    # 原数据路径
    IMG_DIR = "/media/bvision/My Book/boatDetail/images/"
    XML_DIR = "/media/bvision/My Book/boatDetail/xml/"

    # 存储增强后的影像文件夹路径
    AUG_IMG_DIR = "/media/bvision/My Book/boatDetail/new_img/"
    if not os.path.exists(AUG_IMG_DIR):
        os.mkdir(AUG_IMG_DIR)

    # 存储增强后的XML文件夹路径
    AUG_XML_DIR = "/media/bvision/My Book/boatDetail/new_xml/"
    if not os.path.exists(AUG_XML_DIR):
        os.mkdir(AUG_XML_DIR)

    # 数据增强n倍
    simple_example(3, IMG_DIR, XML_DIR, AUG_IMG_DIR, AUG_XML_DIR)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

yolov5

标签数据增强脚本

yolov5标签数据增强脚本的相关文章

window10+TensorRT-8.2.5.1+yolov5 v6.2 c++部署

一准备工具 1 1 visual studio下载安装参考 xff1a vs2019社区版下载教程 xff08 详细 xff09 Redamancy 06的博客 CSDN博客 vs2019社区版 1 2 显卡驱动 43 cuda 43
明火烟雾目标检测项目部署（YoloV5+Flask）

明火烟雾目标检测项目部署文章目录明火烟雾目标检测项目部署1 拉取Docker PyToch镜像2 配置系统环境2 1 更换软件源2 2 下载vim2 3 解决vim中文乱码问题 3 运行项目3 1 拷贝项目到容器中3 2 安装项目所需的
yolov5记录检测框中心坐标

yolov5记录检测框中心坐标最近用到yolov5进行目标检测并确定目标在图片中的位置 xff0c 直接上代码 xff1a 第一步在detect py中建立文件夹并对每张图片建立txt文件 xff1a location center di
yolov5模型问题解决SPPF找不到、yolov5smlx.pt文件下载、coco128文件下载、coco128yaml文件更改、coco128数据集not exist、BrokenPipeErro

问题一 xff1a 运行detect py 报错 xff1a AttributeError Can t get attribute SPPF on lt module models common 原因 xff1a models文件夹的com
yolov3、yolov5和DETR在NVIDIA Xavier测速（TensorRT）

本人实测YoloV3 YoloV5和DETR的TensorRT版本在NVIDIA Xavier上的测速结果如下 xff0c 任何问题留言讨论
yolov5源码解析--损失计算与anchor

本文章基于yolov5 6 2版本主要讲解的是yolov5在训练过程中是怎么由推理结果和标签来进行损失计算的损失函数往往可以作为调优的一个切入点 xff0c 所以我们首先要了解它一代码入口损失函数的调用点如下 xff0c 在tra
RoboCom机器人大赛使用yolov5抽取20个随机图片进行人群识别

目录 1 原理 2 思维流程 2 1 进行yolov5的环境搭建 2 1 1 在Linux的ubuntu环境anaconda的安装 2 1 2 Vscode的安装和配置 2 1 3 Github上面yolov5文件的下载 2 1 4 使用A
Yolov5 更改识别窗口大小

启动yolov5时 xff0c 会因为像素太大导致占据整个桌面 xff0c 这样非常影响使用和操作 xff0c 我们可以通过opencv中的resize函数来修改识别窗口的像素大小 xff0c 这样操作就方便多了原代码中通过修改cv2
YOLOv5训练自己的数据集实现视频的识别

写在前面我本来是使用这个模型进行手写签名的定位 xff0c 但是因为比赛的主办方原因 xff0c 数据不允许公开 xff0c 所以我使用动物世界的一段开头视屏来制作我的数据集这整个模型跑通的过程中 xff0c 我参考了很多不错的博客 x
unbuntu18.04 install pytorch1.8-cpu+yolov5

1 install pytorch 1 change pip source reference link 2 install all pip3 install torchvision 61 61 0 9 0 pip3 install tor
yolov5/v7/v8自动检测多个文件夹及截取锚框

目前yolo仅支持检测图片或单个文件夹 xff0c 但在很多时候需要对成百上千个文件夹中图片进行检测 xff0c 再根据得到的位置信息txt文件来截取图片 xff0c 如何一步完成呢 xff0c 详情见下文在detect py中将save
YOLOv5识别目标的实时坐标打印

引言这个功能看似鸡肋 xff0c 但对于无人机目标识别与追踪有重要意义 xff0c 通过目标在摄像头视野的坐标位置 xff0c 可以推算出无人机相对与目标的位置 xff0c 从而对无人机进行位置矫正因此 xff0c 添加代码打印坐标并不
yolov5代码--注释

yolov5目录结构 yolov5 detect py代码详解 https blog csdn net CharmsLUO article details 123422822 spm 1001 2014 3001 5506 yolov5 t
yolo毕业设计(车辆识别、行人识别、车牌识别)

车牌识别视频车辆识别视频 yolov5车辆识别视频 yolov5 yoloR对比行人车辆识别视频
YOLOv5训练目标检测数据集（小白）

一提前准备工作 1 利用labelimg软件给收集到的图片打标签具体步骤网上都有 2 下载好yolov5 v6 1 源码下载地址 https github com ultralytics yolov5 用pycharm打开在项目目录
睿智的目标检测56——Pytorch搭建YoloV5目标检测平台

睿智的目标检测56 Pytorch搭建YoloV5目标检测平台学习前言源码下载 YoloV5改进的部分不完全 YoloV5实现思路一整体结构解析二网络结构解析 1 主干网络Backbone介绍 2 构建FPN特征金字塔进行加强
使用cocotools对yolov5 6.1的检测结果进行评估（其他模型类似，只需要调整数据格式为coco的就行）

介绍本博客是讲如何使用yolov5对测试集进行检测然后使用cocotools进行评估增加COCOeval的每个类别ap显示 5 0版本模型看这个博客代码 5 0版链接 6 1版链接环境 pytorch只需要保证能跑起来yolov5
基于Yolov5目标检测的物体分类识别及定位（一） -- 数据集原图获取与标注

从本篇博客正式开始深度学习项目的记录实例代码只会放通用的代码数据集和训练数据也是不会全部放出系列文章基于Yolov5目标检测的物体分类识别及定位一数据集原图获取与标注基于Yolov5目标检测的物体分类识别及定位二 yolov
纯代码干货-Python基于YOLOv5的车辆检测并计数

首先你需要安装YOLOv5 可以通过官方文档了解安装步骤和相关依赖接着你需要准备训练好的车辆检测模型和测试图片或视频 1 导入库 import cv2 import torch from models experimental imp
Yolov5部署成为Python接口当然是用flask实现啦~ yolo5写成接口

一在此之前你是不是要先把yolov5跑通 yolov5的环境特别简单建议在Ubuntu18 04下面部署一次成型省去很多麻烦 Ubuntu18 04 RTX2080 CUDA10 0 CUDNN7 4 1 Torch1 3 1GPU

随机推荐

树莓派入门（2）树莓派的远程控制

目录前言SSHPuTTY远程登录树莓派远程桌面连接VNC与树莓派进行文件传输前言在计算机网络中 xff0c 我们可以通过使用C S xff08 客户端服务器 xff09 模式来实现远程控制我们如果想用其他电脑来远程控制树莓派 xf
“我们“App功能介绍

系统及开发配置系统 xff1a Android系统开发工具 xff1a Android Studio4 0 运行要求 xff1a Android系统5 1及以上软件介绍一款娱乐的 xff0c 记录您和爱人纪念日的软件其中包含经典的
Linux/Debian下 root 用户没有声音的解决

Linux Debian下 root 用户没有声音的解决问题 xff1a 新装的Debian11 5 下root用户一直没有声音背景 xff1a Debian11 5 为U盘dvd iso 版本 xff0c root用户下pulse a
dmpython win7安装遇到的问题

系统环境 xff1a win7 python3 6 dm8 20230106 x86 win 64 安装过程及问题 xff1a 打开cmd进入达梦数据库安装目录D soft dm dm8 drivers python dmPython xf
python实现队列

文章目录队列实现操作实现队列实现队列是一种先进先出的数据结构 xff0c 本文用顺序表实现队列操作 Queue 创建一个空的队列enqueue item 往队列中添加一个item元素dequeue 从队列头部删除一个元素is emp
vscode当前工作区不受信任，因此已禁用此扩展

openGL系列文章目录文章目录 openGL系列文章目录前言一解决步骤首先点击左边的扩展 xff0c 或者使用快捷键 xff1a ctrl 43 shift 43 x2 添加插件信任选择扩展工作区信任前言在vscode中安装插件
python实现二叉树的创建

文章目录二叉树的基本概念二叉树的性质特性二叉树的节点表示以及二叉树的创建1 二叉树的节点表示2 二叉树的创建二叉树的基本概念二叉树是每个节点最多有两个子树的树结构通常子树被称作左子树 xff08 left subtree xf
目标跟踪——SORT算法原理浅析

目标跟踪文章目录目标跟踪 SORT算法原理浅析目标跟踪 Deep Sort算法原理浅析基于yolov5与Deep Sort的流量统计与轨迹跟踪文章目录目标跟踪文章目录SORT算法卡尔曼滤波匈牙利算法 SORT核心算法流程总结 SO
目标跟踪——Deep Sort算法原理浅析

目标跟踪文章目录目标跟踪 SORT算法原理浅析目标跟踪 Deep Sort算法原理浅析基于yolov5与Deep Sort的流量统计与轨迹跟踪文章目录目标跟踪文章目录前言多目标跟踪主要流程Deep Sort总结前言背景 xff
基于yolov5与Deep Sort的流量统计与轨迹跟踪

系列文章目录目标跟踪 SORT算法原理浅析目标跟踪 Deep Sort算法原理浅析基于yolov5与Deep Sort的流量统计与轨迹跟踪文章目录系列文章目录前言一整体目录结构二 Deep Sort代码参数解释三代码展示总结
Ubuntu中docker部署gpu版pytorch

文章目录 docker简介安装docker与NVIDIA docker安装docke安装NVIDIA docker 安装显卡驱动拉取pytorch GPU版镜像文件运行pytoch容器总结 docker简介 Docker 是一个开源的应用容
Ubuntu安装cuda与cudnn，亲测可用

文章目录前言一安装显卡驱动二安装cuda三安装cudnn总结前言前段时间被派到现场去部署算法 xff0c 之前同事搭好cuda的环境不好用了 xff0c 具体表现为 xff1a 1 屏幕的分辨率显示很奇怪且不可调节 2 输入nv
实现对python源码加密的方法

文章目录前言一将py文件编译成pyc二将py转化成so文件2 1准备工作2 2新建py2so py文件2 3编译项目文件夹总结前言由于项目的保密性需求 xff0c 对已开发完成的项目需要进行加密处理 xff0c 本文给出两种方法
python配置文件的两种方式

文章目录前言py文件作为配置文件yaml文件作为配置文件总结前言在运行项目程序时通常会有一个配置文件 xff0c 配置文件是用于配置程序的参数和初始化设置的文件比如现在要做一个项目 xff0c 在部署程序时 xff0c 需要摄像头I
Ubuntu18.04安装OpenPCDet：spconv一键安装

文章目录前言本机安装环境安装Spconv安装pcdetclone 项目创建并配置虚拟环境安装pcdet 总结前言最近在摸索点云数据的处理 xff0c 希望实现对点云数据的目标检测但是在复现PointPillars算法时遇到很多坑 x
OpenPCDet 训练自己的数据集详细教程！

文章目录前言一 pcd转bin二 labelCloud 工具安装与使用三训练仿写代码对pcdet datasets custom custom dataset py进行改写新建tools cfgs dataset configs cus
Ubuntu16.04 用Nomachine进行远程控制的配置

本文介绍如何在Ubuntu16 04环境下运用Nomachine进行远程控制一 NoMachine介绍 NoMachine是一款基于NX技术进行远程控制的软件 xff0c 最大的优势是跨平台 xff0c 简单 xff0c 可以实现Linu
ROS一键安装

文章目录前言ROS一键安装总结前言这段时间接触到了雷达点云数据 xff0c 用到了ROS系统 xff0c 在安装过程中完成了手动安装 xff0c 也尝试了一键安装 xff0c 特此记录下一键安装方法 ROS一键安装 wget http
labelimg voc与yolo数据标签互转脚本

xml2txt span class token keyword import span os span class token punctuation span path span class token keyword import s
yolov5标签数据增强脚本

此代码用于将标注好的图片及其标签进行数据增强 xff0c 优点在于不需要重新打标签 span class token keyword import span xml span class token punctuation span etr

yolov5标签数据增强脚本

yolov5标签数据增强脚本 的相关文章

随机推荐

热门标签

yolov5标签数据增强脚本的相关文章