一、voc数据集按比例划分train、val

2023-11-13

下载的voc数据集 images ,annotations.

经下代码按比例划分成,只需要修改中文批注部分路

import os
import sys
import random
import shutil


if __name__ == '__main__':
    train_percent = 0.8  # 训练集比例
    val_percent = 0.2   # 验证集比例

    Root = '../datasets/voc-end/'  # 数据集文件夹路径
    imgs_path = Root + 'images/'    # 图片路径
    xml_path = Root + '/annotations/'  # 标注路径
    data_c = ['jpg', 'xml']     # 数据种类 如.jpeg需修改成jpeg
    
    imgs_list = []
    xml_list = []
    imgs_list = os.listdir(imgs_path)
    xml_list = os.listdir(xml_path)

    if len(imgs_list) != len(xml_list):
        sys.exit("图片数据集和标注不一致，请重新确认数据集！！！！")

    num = len(imgs_list)
    print(num)
    
    ftrain = open(Root+'train.txt', 'w')  # 训练集图片名称列表
    fval = open(Root+'val.txt', 'w')  # 验证集图片名称列表

    img_train_dir = imgs_path + "train/"
    img_val_dir = imgs_path + "val/"
    xml_train_dir = xml_path + "train/"
    xml_val_dir = xml_path + "val/"

    if not os.path.exists(img_train_dir):
        os.makedirs(img_train_dir)
    if not os.path.exists(img_val_dir):
        os.makedirs(img_val_dir)
    if not os.path.exists(xml_train_dir):
        os.makedirs(xml_train_dir)
    if not os.path.exists(xml_val_dir):
        os.makedirs(xml_val_dir)
    
    train_num = int(num*train_percent)
    train_sample = random.sample(imgs_list, train_num)
    # print(train_sample)
    # ------------------------------
    #     train img&xml move
    # ------------------------------
    for name in train_sample:
        shutil.move(imgs_path+name, img_train_dir+name)
        print(name)
        a, b = name.split('.')
        t_text = a + '\n'
        ftrain.write(t_text)
        shutil.move(xml_path+a+'.xml', xml_train_dir+a+'.xml')

    v_list = []
    for i in os.listdir(imgs_path):
        c = i[-3::]
        if c in data_c:
            v_list.append(i)
    # ------------------------------
    #     val img&xml move
    # ------------------------------
    for v_name in v_list:
        shutil.move(imgs_path+v_name, img_val_dir+v_name)
        print(v_name)
        a, b = v_name.split('.')
        v_text = a + '\n'
        fval.write(v_text)
        shutil.move(xml_path+a+'.xml', xml_val_dir+a+'.xml')
    # ------------------------------
    #       train & val list text
    # ------------------------------

    ftrain.close()
    fval.close()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据集处理

计算机视觉

一、voc数据集按比例划分train、val 的相关文章

(ESP32学习13)驱动TFTLCD（SPI接口）

本篇博文教大家ESP32 驱动TFT SPI驱动本文给大家的库直接适用于2寸 240 320 的SPI TFT 但实际上这种驱动移植适用于所有的SPI驱动的TFT屏幕底层代码把LCD初始化里面的寄存器参数改一改就适用了这些寄存器参数在

随机推荐

基于STM32F103循迹小车

本人小白一个利用暑假时间在家做一些小东西我这次想要跟大家分享的是基于STM32F103的循迹小车的制作两个轮子主要硬件板子 L298N 电机 4个循迹模块等话不多说先上干货 XJ c include XJ h 循迹文件 inc
KEIL下载报错——TRACE HW not present

使用st link调试遇到烧写完成之后不能进入调试状态提示TRACE HW not present 点击确认提示错误 Erron target DLL has been cancelled Debugger aborted 解决办法第
何在python里面用tkinter模块做一个GUI界面，实现button点击之后弹出新页面，新页面是一些文字内容

首先弹出新页面需要用到callback函数代码编写如下 import scapy from tkinter import root tk Tk root wm geometry 600x400 root title tk def call
ShinyApp中的表格：第三天笔记

shiny中的表格除了在shinyapp中生成图片有时还需要生成表格用于查看数据以及保存下载表格分为两类动态和静态静态的表格更有利于打印和输出pdf 而动态的表格提供了更多的交互式选项还会响应屏幕的大小来进行缩放静态表格
从材质到外观（待续）

很多地方都只有材质然后shader中最终肯定是到片元着色器也就是appearance 后处理是单独的poststage var appearance new Ceisum MaterialAppearance Cesium Mater
一次ORA-39083,ORA-01917的问题解决过程

一次ORA 39083 ORA 01917的问题解决过程今天到导数据的时候遇到了一个问题也不知道有没有其他小伙伴也遇到过按照要求导出一个用户下指定表的部分数据此时使用了expdp的tables参数指定要导出的表这里我导出的是BKG
hdu 6311 Cover

无向图的最小路径覆盖找出联通块里所有的奇度点然后两个两个的点互相连边构造成所有点都是偶度数然后就找联通块里有多少条欧拉回路如果回路中有新加的边则答案 include
分析结果循环写入csv

30户的暖气的分析结果复制粘贴下来发给队友好像是有点多了一个对话框都过不去被嫌弃了你就不能给我打包个excel 好吧 import csv with open result csv w as csvfile writer csv wr
Docker 安装运行 ElasticSearch 遇到的问题！

在创建 6 4 3版本的 ES 以后启动发现过了一会 ES 自动退出了原因好像是 ES 的默认分配的内存太大了进程被自动杀死了所以以下我来记录下这坑使用ES工具类索引时运行测试方法时报错 org elasticsearch tran
【linux--------基础Apache配置】

这里写目录标题关于Apache介绍部署简单的Apache静态网站常见问题关于Apache介绍 Apache是一个开源的Web服务器软件它是世界上最流行的Web服务器之一 Apache的全称为Apache HTTP Server 它
cublas 实战

导言搞了一段时间的CUDA程序虽然也不是写不出复杂程序但是写个矩阵乘法都要搞个半天还要担心各种性能瓶颈不过还好有cublas 实现了非常多的数学运算这下子可以好好利用一番以后再也不用担心自己写的CUDA效率不高了入门 cu
查看ssh端口号_更改centos系统ssh连接端口号

由于本人平时爱折腾之前趁着阿里云和腾讯云搞活动期间分别搞了台服务器刚开始的时候服务器的防护措施没有做好陆陆续续服务器被黑了好几次最惨的一次是搭建的知识库的服务器被黑导致所有的数据丢失黑客在服务器留言需要0 25个比特币赎回数据
记2016.10.15百度面试经历，软件研发工程师

9月参加的网上笔试选择主要做了一些行测的题头一次做行测题后面有三道编程题做出来一道卡在第二道了50 感觉自己水水的百度也一直没通知面试以为被刷了就没抱什么希望后来13号竟然发来了面试通知还是有点小激动要求9 00 并且提前
Quartz.NET简明示例

下面是一个 Quartz NET 的简单例子初始化调度器工厂 ISchedulerFactory sf new StdSchedulerFactory 获取默认调度器 IScheduler scheduler sf GetSchedule
Linux 反引号、单引号、双引号简析

文章目录一引号的作用二反引号三单引号四双引号五引号解释顺序一引号的作用 1 将多个因为空格或者回车等分隔符隔开的字符串合在一起避免被命令行解析分开例如 a b c 是一个字符串而不会像 a b c 这样会被解析
6.基于STM32C8T6的四旋翼无人机的飞控制作----实践操作1，AD电路板绘制-前期准备

飞控的各种芯片是焊接在电路板上的电路板是各种传感器和接口的载体电路板的设计过程也是极其考验耐心和仔细程度的在大公司里都是每个部门负责其中的一部分工作如原理图设计布局布线测试等等在小公司和大学生的设计中经常需要一个人走完全部的
【Linux杂学】CMake：编写 CMakeLists

CMake官网掌握CMake 1 变量 CMake 变量名称区分大小写且只能包含字母数字字符和下划线 CMAKE 变量存储均为字符串是CMake 自定义变量命名应避开 set 可设变量值第一参数是变量名其余参数是值多个参数被
Kylin 大数据下的OLAP解决方案和行业典型应用

最近工作中应用到了 Kylin 因此调研了 Kylin的原理和行业应用本文参考了官网和众多其他公司中 Kylin的应用案例文末给出了出处希望对大家有帮助 Apache Kylin的原理和技术架构 Apache Kylin 从数据仓库中
火狐浏览器关闭百度热榜（屏蔽网站特定元素）

2023 1 26更新火狐浏览器不能下载 uBlock Origin 解决方法 https github com AdguardTeam AdguardBrowserExtension releases How to install be
一、voc数据集按比例划分train、val

下载的voc数据集 images annotations 经下代码按比例划分成只需要修改中文批注部分路 import os import sys import random import shutil if name main trai

一、voc数据集按比例划分train、val

一、voc数据集按比例划分train、val 的相关文章

随机推荐

热门标签