日常学习 mmsegmentation处理数据集和图片格式

2023-10-27

mmsegmentation 对数据集的读取与处理

对于自定义数据集需要在mmseg/datasets下建立自己的数据集文件,如

import os.path as osp
from .builder import DATASETS
from .custom import CustomDataset

@DATASETS.register_module()  # 注册   不要忘记在__init__.py作显示导入
class RoadDataset(CustomDataset):
    CLASSES = ('background', 'foreground')   # 类别名称设置
    PALETTE = [[120, 120, 120], [6, 230, 230]]  # 调色板设置

    def __init__(self,**kwargs):
        super(RoadDataset, self).__init__(
            img_suffix='_sat.jpg',  # img文件‘后缀’
            seg_map_suffix='_mask.png',  # gt文件‘后缀’

            """
               对于二分类设成False,对于多分类，视数据集而定，对于ade20k为True
               因为0代表背景，但是不包含在150个类别中
            """

            reduce_zero_label=False,   

            **kwargs)
        assert osp.exists(self.img_dir)

同时需要在configs/dataset下建立自己的数据处理配置文件，如

# dataset settings
dataset_type = 'RoadDataset'
data_root = 'data/DeepGlobe'
img_norm_cfg = dict(
    mean=[90.473, 91.277, 83.520], std=[50.5127, 48.89, 48.681], to_rgb=True)
img_scale = (1024, 1024)  # 图像的原始尺寸
crop_size = (256, 256)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations'),
    dict(type='Resize', img_scale=img_scale, ratio_range=(0.5, 2.0)),
    dict(type='RandomCrop', crop_size=crop_size, cat_max_ratio=0.75),
    dict(type='RandomFlip', prob=0.5),
    dict(type='PhotoMetricDistortion'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size=crop_size, pad_val=0, seg_pad_val=255),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_semantic_seg'])
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=img_scale,
        flip=False,
        transforms=[
            dict(type='Resize', keep_ratio=True),
            dict(type='RandomFlip'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='ImageToTensor', keys=['img']),
            dict(type='Collect', keys=['img']),
        ])
]
data = dict(
    samples_per_gpu=8,
    workers_per_gpu=4,
    train=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='train/img',
        ann_dir='train/label',
        pipeline=train_pipeline),
    val=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='val/img',
        ann_dir='val/label',
        pipeline=test_pipeline),
    test=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='val/img',
        ann_dir='val/label',
        pipeline=test_pipeline))

mmsegmentation中要求，gt的像素值应该在[0,N-1],其中N为类别数
这个很重要，像素的值得从0开始逐渐递增。

我之前就在处理potsdam数据集的时候，重新二值化把像素的值设置成了1，2，3，4，5，6、结果就有一类的精度异常，怎么都是0。
比如在2分类的时候，像素的值就得是0，1. （0，255）的设置用于训练跑的起来，但是结果不对。
在这里插入图片描述

参考链接：
https://zhuanlan.zhihu.com/p/380189172

2. mmsegmentation调色板palette的使用

对分割结果进行可视化时，往往可以通过调色板技术将灰度图显示为彩色图

在mmsegmentation中的核心代码如下（以ade20K为例）：

调色板的定义：

PALETTE = [[120, 120, 120], [180, 120, 120], [6, 230, 230], [80, 50, 50],
               [4, 200, 3], [120, 120, 80], [140, 140, 140], [204, 5, 255],
               [230, 230, 230], [4, 250, 7], [224, 5, 255], [235, 255, 7],
               [150, 5, 61], [120, 120, 70], [8, 255, 51], [255, 6, 82],
               [143, 255, 140], [204, 255, 4], [255, 51, 7], [204, 70, 3],
               [0, 102, 200], [61, 230, 250], [255, 6, 51], [11, 102, 255],
               [255, 7, 71], [255, 9, 224], [9, 7, 230], [220, 220, 220],
               [255, 9, 92], [112, 9, 255], [8, 255, 214], [7, 255, 224],
               [255, 184, 6], [10, 255, 71], [255, 41, 10], [7, 255, 255],
               [224, 255, 8], [102, 8, 255], [255, 61, 6], [255, 194, 7],
               [255, 122, 8], [0, 255, 20], [255, 8, 41], [255, 5, 153],
               [6, 51, 255], [235, 12, 255], [160, 150, 20], [0, 163, 255],
               [140, 140, 140], [250, 10, 15], [20, 255, 0], [31, 255, 0],
               [255, 31, 0], [255, 224, 0], [153, 255, 0], [0, 0, 255],
               [255, 71, 0], [0, 235, 255], [0, 173, 255], [31, 0, 255],
               [11, 200, 200], [255, 82, 0], [0, 255, 245], [0, 61, 255],
               [0, 255, 112], [0, 255, 133], [255, 0, 0], [255, 163, 0],
               [255, 102, 0], [194, 255, 0], [0, 143, 255], [51, 255, 0],
               [0, 82, 255], [0, 255, 41], [0, 255, 173], [10, 0, 255],
               [173, 255, 0], [0, 255, 153], [255, 92, 0], [255, 0, 255],
               [255, 0, 245], [255, 0, 102], [255, 173, 0], [255, 0, 20],
               [255, 184, 184], [0, 31, 255], [0, 255, 61], [0, 71, 255],
               [255, 0, 204], [0, 255, 194], [0, 255, 82], [0, 10, 255],
               [0, 112, 255], [51, 0, 255], [0, 194, 255], [0, 122, 255],
               [0, 255, 163], [255, 153, 0], [0, 255, 10], [255, 112, 0],
               [143, 255, 0], [82, 0, 255], [163, 255, 0], [255, 235, 0],
               [8, 184, 170], [133, 0, 255], [0, 255, 92], [184, 0, 255],
               [255, 0, 31], [0, 184, 255], [0, 214, 255], [255, 0, 112],
               [92, 255, 0], [0, 224, 255], [112, 224, 255], [70, 184, 160],
               [163, 0, 255], [153, 0, 255], [71, 255, 0], [255, 0, 163],
               [255, 204, 0], [255, 0, 143], [0, 255, 235], [133, 255, 0],
               [255, 0, 235], [245, 0, 255], [255, 0, 122], [255, 245, 0],
               [10, 190, 212], [214, 255, 0], [0, 204, 255], [20, 0, 255],
               [255, 255, 0], [0, 153, 255], [0, 41, 255], [0, 255, 204],
               [41, 0, 255], [41, 255, 0], [173, 0, 255], [0, 245, 255],
               [71, 0, 255], [122, 0, 255], [0, 255, 184], [0, 92, 255],
               [184, 255, 0], [0, 133, 255], [255, 214, 0], [25, 194, 194],
               [102, 255, 0], [92, 0, 255]]

调色板的使用：

seg = np.array(seg_map)
color_seg = np.zeros((seg.shape[0], seg.shape[1], 3), dtype=np.uint8)   
for label, color in enumerate(PALETTE):
    color_seg[seg == label, :] = color  # numpy 数组的“新奇”使用，就是把预测结果的灰度像素值改成RGB
    color_seg = color_seg[..., ::-1] # convert to BGR （cv2的存储顺序是GBR,所以逆序读取RGB就行了）
    cv2.imwrite(out_file,color_seg)

ps：PIL中的调色板模式为P，每个像素值对应一个RGB值

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

语义分割

日常

学习

python

深度学习

日常学习 mmsegmentation处理数据集和图片格式的相关文章

无法使用 BeautifulSoup 和 Requests 抓取下拉菜单

我想抓取百年灵网站上的产品页面以获取各种信息示例页面 https www breitling com gb en watches navitimer b01 chronograph 46 AB0127211C1A1 https www b
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
使用 WSGI 在 Windows XAMPP 中设置 Python 路径

我正在 Webfaction 上设置实时服务器的开发版本在本地计算机上的虚拟 Apache 服务器环境运行没有任何错误中运行 Django 应用程序 XP 使用 Python 2 6 运行 XAMPP Lite 我可以提交更改通过 G
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
在python中读取PASCAL VOC注释

我在 xml 文件中有注释例如这个它遵循 PASCAL VOC 约定
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
在Python中连续解析文件

我正在编写一个脚本该脚本使用 HTTP 流量行解析文件并取出域目前仅将它们打印到屏幕上我正在使用 httpry 将流量连续写入文件这是我用来删除域名的脚本 usr bin python import re input open r
Python 导入非常慢 - Anaconda python 2.7

我的 python import 语句变得非常慢我使用 Anaconda 包在本地运行 python 2 7 导入模块后我编写的代码运行得非常快似乎只是导入需要很长时间例如我使用以下代码运行了一个 tester py 文件 imp
在 Python 中访问 argparse 的参数值

我正在尝试为我的程序设置一些简单的标志参数但无法弄清楚如何访问它们我有 argparser parser argparse ArgumentParser description Simple PostScript Interpreter
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
如何使用 Pandas Series 绘制两个不同长度/开始日期的时间序列？

我正在绘制每周总事件的几个熊猫系列对象系列中的数据events per week看起来像这样 Datetime 1995 10 09 45 1995 10 16 63 1995 10 23 83 1995 10 30 91 1995

随机推荐

ExtJS 容器布局方式

ExtJS是构建浏览器应用界面的框架为开发人员提供了丰富UI组件这些组件在页面中是以特定方式排列的即布局方式一个ExtJS构建的页面无论看起来多么复杂最终都能根据其布局拆分成许多小的区域最近工作中的项目比较老旧使用的是3 0
vue子组件向父组件传值的方法

子组件向父组件使用 emit方法 demo 子组件的代码
【手把手带你准备电赛】解答小课堂——串口通信和串行通信

目录串口通信和串行通信的定义串口通信和串行通信的区别串口通信和串行通信的联系串口串行你分清楚这两个概念了吗是不是还是串什么通信串行通信什么串口不要担心这篇文章小蛋糕带你深入浅出分清串口通信和串行通信串口通信和串行通
k线图中趋势线的画法精讲

曾经有技术分析师大师把技术分析概括为一句话那就是一把直尺走天下这是画线分析方法的直观和有效的高度概括在众多的画线方法中趋势线用以衡量贵金属的价格趋势通过趋势线的方向可以明确地看出价格变动的方向一上升趋势线的画法在上升趋势中
Ubuntu下pycharm的安装和卸载

pycahrm安装首先要去pycharm的官方网站下载Linux版本的pycharm安装包如果想要下载以前版本的pycharm可以登录下方的网站去下载 https www jetbrains com pycharm download o
按摩软件仿东郊到家系统开发，上门预约系统；

按摩软件仿东郊到家系统开发上门预约系统用户端技师端商家端以及管理后台上门预约的操作 1 技师管理技师满意度进行统一跟踪评估进行分级管理分级评估 2 订单管理按订单状态分类筛选安装进度一目了然 3 智能派单根据客户位置
64位机器源码安装遇到的问题，解决，一锅端

1 如果是centos5会出现如下问题 checking host system type Invalid configuration x86 64 unknown linux gnu machine x86 64 unknown not
Hexo-零基础搭建个人博客(详解)

Hexo零基础搭建个人博客 Hexo是一个基于 node js的快速生成静态博客的开源框架支持 Markdown和大多数 Octopress 插件一个命令即可部署到 Github页面 Giteee Heroku等强大的APl 可无限扩
数据库关闭四种方式

数据库关闭四种方式 shutdown 参数默认normal abort 模拟突然掉电内存被清空内存中的数据没有写入数据文件事务被立即中断没有提交也没有回滚 immediate 强制中断当前正在运行的所有事务回滚这些事务回滚完毕
c语言编写简易的自动售货机程序

今天本来想做一个弹窗的可以输入有按钮点确定的自动售货机程序的但是因为学校没教我是自学的找了一下午不是教我如何创建的就是代码各种报错的我试了一下午都不行只能放弃了今天这串代码是根据我的c语言笔试我们有上机考试的的其中一道编程的
二、量化选股

文章目录总体介绍一基本面选股 1 因子选股判断方法五个步骤 2 风格轮动 3 行业轮动二市场行为选股 1 资金流 2 动量反转基本概念 1 行为金融学 2 阿尔法动量模型 3 一致预期 4 趋势追踪基本概念 5 筹码选股
uniGUI用Grid++Report报表插件设计保存报表(For unigui ver:0.95.0.1045)

uniGUI的0 95 0 1045版本提供了CallbackUrl 我们也可以用这个提供的回调网址来实现优秀的国产报表插件在IE Chorme FireFox中在线设计并保存报表到服务端的功能界面效果如下代码如下 unit Main
SpringBoot用线程池ThreadPoolExecutor处理百万级数据

SpringBoot用线程池ThreadPoolExecutor处理百万级数据更多优秀文章请扫码关注个人微信公众号或搜索程序猿小杨添加一背景使用JDK线程池ThreadPoolExecutor多线程异步执行批量插入更新等操作
如何优雅地用VScode在Ubuntu服务器上跑cuda代码

0 安装相关软件 VScode 及对应插件推荐VScode配置好远程服务后在服务端添加如下插件 Xming Xming X Server for Windows download SourceForge netDownload Xming
CMake Error: CMake was unable to find a build program corresponding to “Ninja“.

CMake Error CMake was unable to find a build program corresponding to Ninja 使用cmake G ninja 后出现问题报错信息如下所示 CMake Error C
关于dispose 方法的资源释放

当在程序上实现dispose 方法时当前对象所占用的资源会被释放当前对象便不能再被使用但在内存中还并不会被及时的释放要待到下次垃圾回收的时候内存才能得到释放
Redis哨兵模式高可用原理

我们知道主从复制是高可用的基石从库宕机依然可以将请求发送给主库或者其他从库但是 Master 宕机只能响应读操作写请求无法再执行所以主从复制架构面临一个严峻问题主库挂了无法执行写操作无法自动选择一个 Slave 切换为 M
javabean相关问题

目录一般情况下 javabean有哪些具体的规范 JavaBean规范在jsp页中如何实现对它页的引入 or 嵌入 1 第一种 js import 2 第二种 jsp include指令 3 第三种 jsp include动作什么是
Qt笔记8--zlib实现gzip解压

Qt笔记8 zlib实现gzip解压几个月前由于需要使用过zlib解压文本和图片现在将当初的方法记录在这里以便于后续查阅 1 功能及使用方法功能 1 解压gzip压缩的字符串 2 解压gzip压缩的图片方法 1 下载并编译zli
日常学习 mmsegmentation处理数据集和图片格式

mmsegmentation 对数据集的读取与处理对于自定义数据集需要在mmseg datasets下建立自己的数据集文件如 import os path as osp from builder import DATASETS from

日常学习 mmsegmentation处理数据集和图片格式

日常学习 mmsegmentation处理数据集和图片格式 的相关文章

随机推荐

热门标签

日常学习 mmsegmentation处理数据集和图片格式的相关文章