语义分割中图片和mask的可视化

2023-11-04

其实取标题一直以来都是一件麻烦的事，但是如果你要看下去，我想你得有一点语义分割的见解。

用平常的语言描述该问题就是：语义分割出我们感兴趣的目标物，然后输出该目标物的轮廓点。做语义分割其实有很多种方法，你可以用不同的模型去train你的dataset，但是刚接触语义分割的朋友们可能会说，我该怎么分割出我想要的目标物，而不对其它部分的像素做修改？其实这件事并不复杂，一个很直觉的想法是：修改像素对应的RGB值。那怎么修改对应像素的RGB值呢？举例来说，假设你在mmsegmentation框架下用的是SegFormer模型，你应该在class_names.py文件中修改cityscapes中palette（如上图）

问题的前半段很好解决，那如何解决输出目标物轮廓点这件事情呢？一种比较直觉的想法是：将分割好的图片转为二值图，然后在转为灰度图，之后利用cv2.findContours()函数寻找轮廓点，为了验证轮廓点的准确性，再用cv2.drawContours()函数做可视化处理。这样的处理对一些简单的图片是一种策略，但是对于已经语义分割好的图片，再这样处理会不会有一些“脱裤子放屁——多此一举”呢？答案是肯定的。你想想看，你是怎么将一幅图片语义分割出来的呢？是根据每个像素的类别逐一“上色”的对吧。那这么说来，其实要做输出轮廓点这件事，只要让模型输出一张分割后的二maskt图片，然后转为灰度图，再重复上面说的cv2.findContours()、cv2.drawContours()的操作就可以了吧？

那这里有一个前提，什么前提呢？前提是你已经知道如何修改像素值这件事情。所以在SegFormer里面，你可以在base.py文件中进行修改，一些注释我已经写在代码里面：

    def show_result(self,
                    img,
                    result,  # 这里的result就是每个像素的类别，它的大小应该与你的图片大小有关
                    palette=None,
                    win_name='',
                    show=False,
                    wait_time=0,
                    out_file=None):
        """Draw `result` over `img`.

        Args:
            img (str or Tensor): The image to be displayed.
            result (Tensor): The semantic segmentation results to draw over
                `img`.
            palette (list[list[int]]] | np.ndarray | None): The palette of
                segmentation map. If None is given, random palette will be
                generated. Default: None
            win_name (str): The window name.
            wait_time (int): Value of waitKey param.
                Default: 0.
            show (bool): Whether to show the image.
                Default: False.
            out_file (str or None): The filename to write the image.
                Default: None.

        Returns:
            img (Tensor): Only if not `show` or `out_file`
        """
        img = mmcv.imread(img)
        img = img.copy()
        seg = result[0]
        if palette is None:
            if self.PALETTE is None:
                palette = np.random.randint(
                    0, 255, size=(len(self.CLASSES), 3))
            else:
                palette = self.PALETTE
        palette = np.array(palette)
        assert palette.shape[0] == len(self.CLASSES)
        assert palette.shape[1] == 3
        assert len(palette.shape) == 2
        color_seg = np.zeros((seg.shape[0], seg.shape[1], 3), dtype=np.uint8)
        for label, color in enumerate(palette):
            color_seg[seg == label, :] = color  # 注意数组的特别用法
        # convert to BGR
        color_seg = color_seg[..., ::-1]

        # from IPython import embed; embed(header='debug vis')
        # img = img * 0.5 + color_seg * 0.5  # 这两步是修改的地方
        # img = img.astype(np.uint8)


        # if out_file specified, do not show image in window
        if out_file is not None:
            show = False

        if show:
            mmcv.imshow(img, win_name, wait_time)
        if out_file is not None:
            mmcv.imwrite(img, out_file)

        if not (show or out_file):
            warnings.warn('show==False and out_file is not specified, only '
                          'result image will be returned')
            return color_seg  #这一步也是修改的地方，原来是return img，这样就是分割出输出，为不是mask后的图输出

有了输出的mask图像（与原始图片的一一对应），就可以很方便的在原图进行可视化操作：

result = inference_segmentor(model_seg, p)  # 前向推理，得到每个像素的类别
img_seg = show_result_pyplot(model_seg, p, result, get_palette(opt.palette))  # 得到分割后的mask
img = cv2.imread(p)  # 这一步是为了轮廓在原图中显示，我这里的p实际上是我的图片路径
gray_img = cv2.cvtColor(img_seg, cv2.COLOR_BGR2GRAY)  # 转为灰度图
contours, _ = cv2.findContours(gray_img, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)  # 寻找轮廓点
res = cv2.drawContours(img, contours, -1, (0, 0, 255), 1)  # 绘制轮廓点

可视化后的效果（mask——原图——轮廓）：

当然，轮廓检测的方法还有很多，希望你不会因此局限。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

语义分割中图片和mask的可视化的相关文章

用通俗易懂的方式讲解：内容讲解+代码案例，轻松掌握大模型应用框架 LangChain

本文介绍了 LangChain 框架它能够将大型语言模型与其他计算或知识来源相结合从而实现功能更加强大的应用接着对LangChain的关键概念进行了详细说明并基于该框架进行了一些案例尝试旨在帮助读者更轻松地理解 LangChai
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
用CHAT写一份标题为职业教育教师教学能力提升培训总结

CHAT回复标题职业教育教师教学能力提升培训总结一活动概述本次由学校组织的职业教育教师教学能力提升培训于8月15日至8月20日顺利进行来自全校的60位职业教育教师参与了此次培训主讲人为享有盛名的教育专家马丁先生二培训内容与
利用CHAT写实验结论

问CHAT 通过观察放置在玻璃表面上的单个水滴人们可以观察到水滴充当成像系统探究这样一个透镜的放大倍数和分辨率 CHAT回复实验报告标题利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率一实验目的通过对比和测量研究和探索玻
活动日程&直播预约｜智谱AI技术开放日 Zhipu DevDay

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入直播预约通道关于AI TIME AI TIME源起于2019年旨在发扬科学思辨精神邀请各界人士对人工智能理论算法和场景应用的本质问题进行探索加强思想碰撞链接全球AI学
毕业设计：基于卷积神经网络的图像分类系统 python人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 卷积神经网络 2 2 SVM算法三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！

AI 大模型技术经过2023年的狂飙 2024年必将迎来应用的落地对 IT 同学来讲这里蕴含着大量的技术机会越来越多的企业开始招聘 AI 大模型岗位本文梳理了 AI 大模型开发技术的面试之道从 AI 大模型基础面 AI 大模型进阶
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
回望计算机视觉会议ICCV的31年

作者原野寻踪编辑汽车人原文链接 https zhuanlan zhihu com p 670393313 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心全栈算法技术交流群本文只做
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
开始弃用NeRF？为什么Gaussian Splatting在自动驾驶场景如此受欢迎？（浙江大学最新）...

点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取今天自动驾驶之心为大家分享浙大刚刚出炉的3D Gaussian Splatting综述文章首先回顾了3D Gaussian的原理和应用借着全面比较了3D GS在静态
15天学会Python深度学习，我是如何办到的？

陆陆续续有同学向我们咨询 Python编程如何上手深度学习怎么学习如果有人能手把手一对一帮帮我就好了我们非常理解初学者的茫然和困惑大量视频书籍广告干扰了大家的判断学习Python和人工智能成为内行人不难为此我们推出了
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

stm32矩阵键盘c语言程序,stm32矩阵键盘原理图及程序介绍

STM32F0 系列产品基于超低功耗的 ARM Cortex M0 处理器内核整合增强的技术和功能瞄准超低成本预算的应用该系列微控制器缩短了采用 8 位和 16 位微控制器的设备与采用 32 位微控制器的设备之间的性能差距能够在经济
大话数据结构1 - 概念、线性表

程序设计数据结构算法数据数据元素数据项数据对象数据结构逻辑结构集合结构线性结构树形结构图形结构物理结构顺序存储结构链式存储结构空间优势数据类型抽象数据类型 ADT abstract data type 算
Python工业项目实战01：项目介绍及环境构建

知识点01 课程目标项目目标项目1 在线教育学习如何做项目项目中大数据工程师要负责实现的内容和流程学习数仓基础理论建模分层项目2 一站制造企业中项目开发的落地代码开发代码开发 SQL DSL SQL SparkCore
免费的插画素材网站有哪些？

面对紧急设计项目设计师会选择使用外力来完成项目免费插图网站可以帮助我们在这个时候解决问题但大多数插图网站都是收费的需要版权或特别丑陋的基本上很少有免费的没有版权的好插图但今天我想推荐一个免费的插图网站即时设计资源社区即时设计
程序员是否可以在家办公——在家办公的利与弊

对软件技术工作者来说办公的场所对工作效率似乎并没有大的影响毕竟大部分软件工程师给人的印象是埋头于电脑前似乎只要给他们一台能够连上Internet或是公司VPN的电脑他们就能产出我们期望的代码在理想情况下公司还能通过这样的方式
马尔可夫链模型的信贷风险分析与预测

今天为大家介绍马尔科夫链模型信贷中计算风险分析与预测的一个重要模型马尔科夫链模型是啥数学模型中的一个重要的模型是属于一类重要的随机过程马尔可夫链模型由俄国数学家马尔可夫于1907年提出人们在实际中常遇到具有下述特性的随机过程
条件分支if和else的使用详解

顺序结构没什么好讲的就是从上到下的写代码所以接下来壹哥就直接带各位来学习分支结构里的条件分支我们在前面说过分支结构或者叫做条件分支其实有两种情况一种是if else 类型的条件分支一种是switch case 类型的条件分
链表反转全家桶（一）：动画详解单链表反转

单链表的反转是一个easy级别的题目这个题目在力扣上的提交次数达到47万次而且在面试中也频频出现可谓是大受欢迎它的兄弟们也跟着风光了这道题本身是比较简单的而它的难兄难弟就不是那么简单了今天这篇文章先从简单开始分析单链表的
Navicat运行sql文件导入数据不全或导入失败

前言我们平时想把数据从一个数据库中导入另外一个数据库中的时候一般都是把所需的数据表进行转储sql文件然后再运行sql文件导入新的数据库中这么做数据少的时候一般不会出现什么错但是如果数据量比较大表比较多就会出现缺少数据表或
Android自定义控件-----放大镜

public class ShaderView extends View private final Bitmap bitmap private final ShapeDrawable drawable 放大镜的半径 private sta
转载：原文http://www.cnblogs.com/gao241/p/3522143.html

shell实例手册 0说明手册制作雪松更新日期 2013 12 06 欢迎系统运维加入Q群 198173206 请使用 notepad 打开此文档 alt 0 将函数折叠后方便查阅请勿删除信息转载请说明出处抵制不道德行为错误在
常见的图像滤波算法

本文介绍五种常见的图像滤波方式线性滤波方框滤波均值滤波高斯滤波非线性滤波中值滤波双边滤波提醒本文主要是算法公式没有具体完整的代码一线性滤波总的来说这三种线性滤波原理每个像素的输出值是输入像素的加权和其处理方式
mysql通过二进制日志回复数据_详解如何通过Mysql的二进制日志恢复数据库数据...

经常有网站管理员因为各种原因和操作导致网站数据误删而且又没有做网站备份结果不知所措甚至给网站运营和盈利带来负面影响所以本文我们将和大家一起分享学习下如何通过Mysql的二机制日志 binlog 来恢复数据系统环境操作系统 Ce
Apache HTTPD 换行解析漏洞（CVE-2017-15715）

简介 HTTPD就是平常大家说的apache服务器 HTTPD才是他的真实名字环境搭建使用vulhub里现成的环境部署即可进入vulhub下的httpd CVE 2017 15715 docker compose build dock
【python办公自动化】使用PysimpleGUI实现AHP指标的添加和删除及编号重新排序

使用PysimpleGUI实现AHP指标的添加和删除 1 运行界面 2 添加指标 3 删除指标 4 编码重新排序 5 全部代码 1 运行界面 2 添加指标输入框中输入内容点击添加指标按钮然后就会自动添加到上方列表中 3 删除指标
浩鲸科技2020届c++

1 C 是类型安全的 Java c 语言是类型安全的除非强制类型转换 C语言不是类型安全的因为同一段内存可以用不同的数据类型来解释比如1用int来解释就是1 用boolean来解释就是true 2 float a b c 那么可以如下
记一次SpringBoot打包Jar引入第三方jar包,部署出现ClassNotFound的现象

心有猛虎细嗅蔷薇最近公司和第三方项目进行于是需要引入第三方的SDK来调用一些东西引入进来什么都是很好的但是发布出去就出现各种ClassNotFuoundException等问题然后看下测试环境的log发现了第三方的SDK中的类不
关于hive的启动和连接

目录一前言二 hive的启动与连接 2 1 启动hadoop 2 2 启动hive 2 3 一些注意事项一前言太久没用hive了今天想重新熟悉一下结果发现自己甚至忘记了怎么启动于是特此记录篇笔记便于以后忘记时查阅不会写
hadoop实践（五）win10+eclipse+hadoop2.6.4 开发环境

本人环境为win10 才从win7升级 eclipse是 Kepler Service Release 1 在win10下安装了vm workstation 其上安装了centos6 5 并在上面部署了hadoop2 6 4的伪分布式安装
语义分割中图片和mask的可视化

其实取标题一直以来都是一件麻烦的事但是如果你要看下去我想你得有一点语义分割的见解用平常的语言描述该问题就是语义分割出我们感兴趣的目标物然后输出该目标物的轮廓点做语义分割其实有很多种方法你可以用不同的模型去train你的data

语义分割中图片和mask的可视化

语义分割中图片和mask的可视化 的相关文章

随机推荐

热门标签

语义分割中图片和mask的可视化的相关文章