一、voc数据集按比例划分train、val

2023-11-13

下载的voc数据集 images ,annotations. 

经下代码 按比例划分成,只需要修改中文批注部分路

import os
import sys
import random
import shutil


if __name__ == '__main__':
    train_percent = 0.8  # 训练集比例
    val_percent = 0.2   # 验证集比例

    Root = '../datasets/voc-end/'  # 数据集文件夹路径
    imgs_path = Root + 'images/'    # 图片路径
    xml_path = Root + '/annotations/'  # 标注路径
    data_c = ['jpg', 'xml']     # 数据种类 如.jpeg需修改成jpeg
    
    imgs_list = []
    xml_list = []
    imgs_list = os.listdir(imgs_path)
    xml_list = os.listdir(xml_path)

    if len(imgs_list) != len(xml_list):
        sys.exit("图片数据集和标注不一致,请重新确认数据集!!!!")

    num = len(imgs_list)
    print(num)
    
    ftrain = open(Root+'train.txt', 'w')  # 训练集图片名称列表
    fval = open(Root+'val.txt', 'w')  # 验证集图片名称列表

    img_train_dir = imgs_path + "train/"
    img_val_dir = imgs_path + "val/"
    xml_train_dir = xml_path + "train/"
    xml_val_dir = xml_path + "val/"

    if not os.path.exists(img_train_dir):
        os.makedirs(img_train_dir)
    if not os.path.exists(img_val_dir):
        os.makedirs(img_val_dir)
    if not os.path.exists(xml_train_dir):
        os.makedirs(xml_train_dir)
    if not os.path.exists(xml_val_dir):
        os.makedirs(xml_val_dir)
    
    train_num = int(num*train_percent)
    train_sample = random.sample(imgs_list, train_num)
    # print(train_sample)
    # ------------------------------
    #     train img&xml move
    # ------------------------------
    for name in train_sample:
        shutil.move(imgs_path+name, img_train_dir+name)
        print(name)
        a, b = name.split('.')
        t_text = a + '\n'
        ftrain.write(t_text)
        shutil.move(xml_path+a+'.xml', xml_train_dir+a+'.xml')

    v_list = []
    for i in os.listdir(imgs_path):
        c = i[-3::]
        if c in data_c:
            v_list.append(i)
    # ------------------------------
    #     val img&xml move
    # ------------------------------
    for v_name in v_list:
        shutil.move(imgs_path+v_name, img_val_dir+v_name)
        print(v_name)
        a, b = v_name.split('.')
        v_text = a + '\n'
        fval.write(v_text)
        shutil.move(xml_path+a+'.xml', xml_val_dir+a+'.xml')
    # ------------------------------
    #       train & val list text
    # ------------------------------

    ftrain.close()
    fval.close()

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一、voc数据集按比例划分train、val 的相关文章

  • (ESP32学习13)驱动TFTLCD(SPI接口)

    本篇博文教大家ESP32 驱动TFT SPI驱动 本文给大家的库直接适用于2寸 240 320 的SPI TFT 但实际上这种驱动移植适用于所有的SPI驱动的TFT屏幕 底层代码把LCD初始化里面的寄存器参数改一改就适用了 这些寄存器参数在

随机推荐

  • 基于STM32F103循迹小车

    本人小白一个 利用暑假时间在家做一些小东西 我这次想要跟大家分享的是基于STM32F103的循迹小车的制作 两个轮子 主要硬件 板子 L298N 电机 4个循迹模块等 话不多说 先上干货 XJ c include XJ h 循迹文件 inc
  • KEIL下载报错——TRACE HW not present

    使用st link调试遇到烧写完成之后不能进入调试状态 提示TRACE HW not present 点击确认 提示错误 Erron target DLL has been cancelled Debugger aborted 解决办法 第
  • 何在python里面用tkinter模块做一个GUI界面,实现button点击之后弹出新页面,新页面是一些文字内容

    首先弹出新页面需要用到callback函数 代码编写如下 import scapy from tkinter import root tk Tk root wm geometry 600x400 root title tk def call
  • ShinyApp中的表格:第三天笔记

    shiny中的表格 除了在shinyapp中生成图片 有时还需要生成表格 用于查看数据 以及保存下载 表格分为两类 动态和静态 静态的表格更有利于打印和输出pdf 而动态的表格提供了更多的交互式选项 还会响应屏幕的大小来进行缩放 静态表格
  • 从材质到外观(待续)

    很多地方都只有材质 然后shader中 最终肯定是到片元着色器 也就是appearance 后处理是单独的poststage var appearance new Ceisum MaterialAppearance Cesium Mater
  • 一次ORA-39083,ORA-01917的问题解决过程

    一次ORA 39083 ORA 01917的问题解决过程 今天到导数据的时候遇到了一个问题 也不知道有没有其他小伙伴也遇到过 按照要求导出一个用户下指定表的部分数据 此时使用了expdp的tables参数指定要导出的表这里我导出的是BKG
  • hdu 6311 Cover

    无向图的最小路径覆盖 找出联通块里所有的奇度点 然后两个两个的点互相连边 构造成所有点都是偶度数 然后就找联通块里有多少条欧拉回路 如果回路中有新加的边则答案 include
  • 分析结果循环写入csv

    30户的暖气的分析结果复制粘贴下来发给队友 好像是有点多了一个对话框都过不去 被嫌弃了 你就不能给我打包个excel 好吧 import csv with open result csv w as csvfile writer csv wr
  • Docker 安装运行 ElasticSearch 遇到的问题!

    在创建 6 4 3版本的 ES 以后启动发现过了一会 ES 自动退出了 原因好像是 ES 的默认分配的内存太大了 进程被自动杀死了 所以以下我来记录下这坑 使用ES工具类索引时运行测试方法时报错 org elasticsearch tran
  • 【linux--------基础Apache配置】

    这里写目录标题 关于Apache介绍 部署简单的Apache静态网站 常见问题 关于Apache介绍 Apache是一个开源的Web服务器软件 它是世界上最流行的Web服务器之一 Apache的全称为Apache HTTP Server 它
  • cublas 实战

    导言 搞了一段时间的CUDA程序 虽然也不是写不出复杂程序 但是写个矩阵乘法都要搞个半天 还要担心各种性能瓶颈 不过 还好有cublas 实现了非常多的数学运算 这下子可以好好利用一番 以后再也不用担心自己写的CUDA效率不高了 入门 cu
  • 查看ssh端口号_更改centos系统ssh连接端口号

    由于本人平时爱折腾 之前趁着阿里云和腾讯云搞活动期间分别搞了台服务器 刚开始的时候 服务器的防护措施没有做好 陆陆续续服务器被黑了好几次 最惨的一次是搭建的知识库的服务器被黑 导致所有的数据丢失 黑客在服务器留言需要0 25个比特币赎回数据
  • 记2016.10.15百度面试经历,软件研发工程师

    9月参加的网上笔试 选择主要做了一些行测的题 头一次做行测题 后面有三道编程题 做出来一道 卡在第二道了50 感觉自己水水的 百度也一直没通知面试 以为被刷了就没抱什么希望 后来13号竟然发来了面试通知还是有点小激动 要求9 00 并且提前
  • Quartz.NET简明示例

    下面是一个 Quartz NET 的简单例子 初始化调度器工厂 ISchedulerFactory sf new StdSchedulerFactory 获取默认调度器 IScheduler scheduler sf GetSchedule
  • Linux 反引号、单引号、双引号简析

    文章目录 一 引号的作用 二 反引号 三 单引号 四 双引号 五 引号解释顺序 一 引号的作用 1 将多个因为空格或者回车等分隔符隔开的字符串合在一起 避免被命令行解析分开 例如 a b c 是一个字符串 而不会像 a b c 这样会被解析
  • 6.基于STM32C8T6的四旋翼无人机的飞控制作----实践操作1,AD电路板绘制-前期准备

    飞控的各种芯片是焊接在电路板上的 电路板是各种传感器和接口的载体 电路板的设计过程也是极其考验耐心和仔细程度的 在大公司里都是每个部门负责其中的一部分工作 如原理图设计 布局布线 测试等等 在小公司和大学生的设计中 经常需要一个人走完全部的
  • 【Linux杂学】CMake:编写 CMakeLists

    CMake官网 掌握CMake 1 变量 CMake 变量名称区分大小写 且只能包含字母数字字符和下划线 CMAKE 变量 存储均为字符串 是CMake 自定义变量 命名应避开 set 可设变量值 第一参数是变量名 其余参数是值 多个参数被
  • Kylin 大数据下的OLAP解决方案和行业典型应用

    最近工作中应用到了 Kylin 因此调研了 Kylin的原理和行业应用 本文参考了官网和众多其他公司中 Kylin的应用案例 文末给出了出处 希望对大家有帮助 Apache Kylin的原理和技术架构 Apache Kylin 从数据仓库中
  • 火狐浏览器关闭百度热榜(屏蔽网站特定元素)

    2023 1 26更新 火狐浏览器不能下载 uBlock Origin 解决方法 https github com AdguardTeam AdguardBrowserExtension releases How to install be
  • 一、voc数据集按比例划分train、val

    下载的voc数据集 images annotations 经下代码 按比例划分成 只需要修改中文批注部分路 import os import sys import random import shutil if name main trai