【计算机视觉

2023-11-09

一、分割|语义相关(6篇)

1.1 Semantic Image Synthesis via Class-Adaptive Cross-Attention

基于类自适应交叉注意的语义图像合成

https://arxiv.org/abs/2308.16071

在语义图像合成中,现有技术由使用空间自适应归一化层的方法主导,其允许优异的视觉生成质量和编辑多功能性。鉴于它们的功效,最近的研究工作集中在细粒度的局部风格控制和多模态生成。然而,通过构造,这样的层倾向于忽略全局图像统计,从而导致不令人信服的局部样式编辑并且引起全局不一致,诸如颜色或照明分布偏移。此外,生成器中的映射样式需要语义布局,对特性施加严格的对齐约束。作为回应,我们设计了一种新的架构,其中使用交叉注意层代替去规范化层来调节图像生成。我们的模型继承了这两种解决方案的优点,保留了最先进的重建质量,以及改进的全球和本地风格转移。代码和模型可在https://github.com/TFonta/CA2SIS上获得。

1.2 Semi-supervised Domain Adaptation with Inter and Intra-domain Mixing for Semantic Segmentation

基于域间和域内混合的半监督领域自适应语义分割

https://arxiv.org/abs/2308.15855

尽管语义分割技术取得了新的进展,但在实际应用中,由于领域转移导致的性能下降是一个不可避免的挑战。目前解决这个问题的主要方法是无监督域自适应(UDA)。然而,在UDA中没有标记的目标数据是过度限制和限制性能。为了克服这一限制,一个更实际的场景称为半监督域自适应(SSDA)已被提出。现有的SSDA方法源自UDA范式,主要集中在利用未标记的目标数据和源数据。在本文中,我们强调了利用有限的标记目标数据和未标记目标数据之间的域内信息的意义,因为它极大地有利于域适应。而不是仅仅使用稀缺的标记数据的监督,我们提出了一个新的SSDA框架,结合域间混合和域内混合,域间混合减轻源目标域的差距和域内混合丰富了可用的目标域信息。通过同时学习域间混合和域内混合,网络可以捕获更多的域不变特征,并提高其在目标域的性能。我们还探讨了不同的域混合操作,以更好地利用目标域的信息。在GTA5toCityscapes和SYNTHIA2Cityscapes基准测试上进行的综合实验证明了我们的方法的有效性,大大超过了以前的方法。

1.3 Shatter and Gather: Learning Referring Image Segmentation with Text Supervision

破碎与聚集:学习文本监督下的指代图像分割

https://arxiv.org/abs/2308.15512

参考图像分割,分割任意实体描述的自由形式的文本的任务,开辟了各种视觉应用。然而,用于该任务的训练数据的手动标记是昂贵的,导致缺乏用于训练的标记数据。我们通过弱监督学习方法来解决这个问题,该方法使用训练图像的文本描述作为唯一的监督来源。为此,我们首先提出了一个新的模型,发现输入图像中的语义实体,然后结合这些实体相关的文本查询预测的掩码的参考。我们还提出了一个新的损失函数,允许模型在没有任何进一步监督的情况下进行训练。我们的方法进行了评估四个公共基准参考图像分割,在那里它明显优于现有的方法相同的任务和最近的开放词汇分割模型的所有基准。

1.4 Modality Cycles with Masked Conditional Diffusion for Unsupervised Anomaly Segmentation in MRI

基于掩蔽条件扩散的磁共振无监督异常分割方法

https://arxiv.org/abs/2308.16150

无监督异常分割旨在检测与训练期间处理的任何模式不同的模式,通常称为异常或分布外模式,而不提供任何相关联的手动分割。由于部署期间的异常可能导致模型故障,检测异常可以提高模型的可靠性,这在高风险领域,如医学成像是有价值的。本文介绍了掩蔽模态周期与条件扩散(MMCCD),一种方法,使分割的异常在不同的模式在多模态MRI。该方法基于两个基本思想。首先,我们提出使用循环模态翻译作为一种机制,使异常检测。图像转换模型学习组织特异性模态映射,这是组织生理学的特征。因此,这些学习到的映射不能转换在训练期间从未遇到的组织或图像图案,并且错误使得能够进行它们的分割。此外,我们结合图像翻译与掩蔽条件扩散模型,它试图“想象”什么组织下的掩蔽区域,进一步暴露未知的模式,因为生成模型未能重新创建它们。我们通过在BraTS2021多模态MRI的健康外观切片上进行训练并在具有肿瘤的切片上进行测试,在代理任务上评估我们的方法。我们表明,我们的方法相比,有利的是以前的无监督的方法的基础上图像重建和去噪与自动编码器和扩散模型。

1.5 Attention-based CT Scan Interpolation for Lesion Segmentation of Colorectal Liver Metastases

基于注意力的CT扫描插值法在结直肠癌肝转移瘤分割中的应用

https://arxiv.org/abs/2308.15932

结直肠肝转移(CRLM)常见的小肝脏病变对于卷积神经网络(CNN)分割模型来说是具有挑战性的,特别是当我们在计算机断层扫描(CT)扫描中具有广泛的切片厚度时。CT图像的切片厚度可能因临床适应症而异。例如,当需要小血管的精细解剖细节时,更薄的切片用于术前规划。在保持患者的有效辐射剂量尽可能低的同时,由于其局限性,在CRLM中采用各种切片厚度。然而,跨CT的切片厚度的差异导致基于CNN的CT分割模型的显著性能下降。本文提出了一种新的无监督的注意力为基础的插值模型,从连续的三重切片CT扫描生成中间切片。我们在插值模型的训练过程中集成了分割损失,以利用现有切片中的分割标签来生成中间切片。与CT体积中的常见插值技术不同,我们的模型在插值切片中突出显示腹部CT扫描内的感兴趣区域(肝脏和病变)。此外,我们的模型的输出与原始输入切片一致,同时在两个尖端的3D分割流水线中提高了分割性能。我们在CRLM数据集上测试了所提出的模型,对厚切片的主题进行上采样,并为我们的分割模型创建各向同性体积。所产生的各向同性数据集增加了病变分割中的Dice分数,并且在插值度量方面优于其他插值方法。

1.6 Interpretability-guided Data Augmentation for Robust Segmentation in Multi-centre Colonoscopy Data

用于多中心结肠镜检查数据稳健分割的可解释性引导的数据增强

https://arxiv.org/abs/2308.15881

来自不同医疗中心的多中心结肠镜检查图像表现出不同的复杂因素和影响图像内容的叠加,取决于特定的采集中心。现有的深度分割网络难以在这样的数据集中实现足够的概括性,并且当前可用的数据增强方法不能有效地解决数据可变性的这些来源。作为一种解决方案,我们引入了一种创新的数据增强方法,以可解释性显着图为中心,旨在增强深度学习模型在多中心结肠镜图像分割领域的泛化能力。所提出的增强技术在不同的分割模型和域中表现出更高的鲁棒性。在公开的多中心息肉检测数据集上进行的彻底测试证明了我们方法的有效性和多功能性,这在定量和定性结果中都可以观察到。该代码可在以下网址公开获取:https://github.com/nki-radiology/interpretability_augmentation

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【计算机视觉 的相关文章

随机推荐

  • Unable to negotiate with 10.11.81 port 8235: no matching host key type found. Their offer: ssh-rsa

    mac电脑重装系统 去官网下载了最新的git安装 一路next下来 打开bash按老路子设置 生成公钥 git config global user name yourname git config global user email yo
  • 微信小程序Day2笔记

    1 WXML模板语法 1 数据绑定 数据绑定的基本原则 在data中定义数据 在WXML中使用数据 2 在data中定义页面的数据 在页面对应的 js文件中 把数据定义到data对象中 3 Mustache语法的格式 把data中的数据绑定
  • 网络协议介绍

    网络层的功能 定义了基于IP协议的逻辑地址 连接不同的媒介类型 选择数据通过网络的最佳路径 IP数据包格式 协议字段 ICMP协议 Internet控制报文协议 1 ICMP是一个 错误侦测与回馈机制 2 通过IP数据包封装的 3 用来发送
  • vue中安装和使用Dplayer视频播放器

    1 下载 npm下载 npm install dplayer s npm i hls js s yarn下载 yarn add dplayer yarn add hls js 2 使用
  • cpolar如何配置固定TCP地址

    通常 每次启动 TCP 隧道时都会随机分配远程TCP地址和端口 它会在24小时后随机变化 对于生产环境的服务或经常访问的TCP地址 很不方便 您通常需要一个稳定的 固定端口的远程TCP地址 为此 让我们来配置一个永久固定的公网TCP地址 首
  • Visual Studio 2022 版本 17.5 预览版 正式上线,有你期待的功能吗?

    目录 此次发布的 Visual Studio 2022 版本 17 5 预览版中的新增功能摘要 C 代码搜索和导航 Git 工具 Markdown 调试和诊断 一元搜索汇报 集成终端中的 ASP NET 输出 按正则表达式着色制表符 编辑
  • 高数--猴博士爱讲课

    重点章节 导数 微分 积分 梯度 泰勒展开公式 第一课 求极限 求极限 函数 例一 试求 l i m x
  • vue3+element-plus封装表格

    1 封装表格 封装的表格如何使用插槽可以到这参考 vue3封装element plus表格使用插槽 小了黑了兔 的博客 CSDN博客
  • JMeter学习笔记15-如何用JMeter做接口测试

    本文介绍JMeter如何做web service测试 一般来说web服务 一般指的是HTTP请求相关的内容 这里就介绍一下如何利用JMeter做基于HTTP的web接口测试 接口也叫API Application Programming I
  • 爬虫技术-字体反爬

    文本混淆章节 1 文本混淆简介 简单而言就是利用前端技术干扰 页面可以正常展示 而使用爬虫下载后无法提取正常的数据 1 1 常见的干扰方式 字体反爬 2 字体反爬 2 1 字体反爬简介 在 CSS3 之前 Web 开发者必须使用用户计算机上
  • Vue3+Vite+Ts的Axios企业级封装+本地存储封装

    前言 实际项目开发中 向后台发请求 vue相关项目 都是用axios 不会用ajax 不会为了ajax单独去引入jquery axios官网 http www axios js com 第一步 下载依赖axios npm i axios s
  • 关于java内访问流式接口处理

    我找了一圈 没找到合适得方法 知识面得欠缺 会让遇到问题没有办法 最后联系百度智能才知道怎么做 给百度智能AI一个好评 我也是才知道一般的写法都是OKhttp OkHttp 会阻塞直到所有响应都回来后才会整体返回 建议您用原生HttpURL
  • idea搭建Spark开发环境

    最近在公司换了一个项目组 做Spark项目的 于是开始学Spark 版本
  • 基于epoll的聊天室程序

    epoll相对于poll和select这两个多路复用的I O模型更加的高效 epoll的函数很简单 麻烦的地方在于水平出发和边沿触发 用张图来说明下 ET 边沿 只是在状态反转时触发 比如从不可读到可读 而LT 水平 就是如果可读 就会一直
  • ELK 企业级日志分析系统 ELFK

    一 概述 ELK平台是一套完整的日志集中处理解决方案 将 ElasticSearch Logstash 和 Kiabana 三个开源工具配合使用 完成更强大的用户对日志的查询 排序 统计需求 使用ELK日志文件系统的原因 日志主要包括系统日
  • mysql中索引利用情况(explain用法)

    使用explain查看 如下 1 首先创建表test 语句如下 create table test a int b varchar 10 c varchar 10 2 在表中的a b都创建索引 先后顺序是a b create index i
  • 在使用vue ui创建新项目时出现问题Cannot read property ‘indexOf‘ of undefined

    问题描述 在使用vue ui创建新项目时出现问题 Cannot read property indexOf of undefined 原因分析 主要是自己的版本太低了 node npm和vue cil的版本太低了 查看node版本 node
  • 信息安全技术网络安全等级保护基本要求GB/T 22239一2019(第二级安全要求)

    安全保护能力 第二级安全保护能力 应能够防护免受来自外部小型组织的 拥有少量资源的威胁源发起恶意攻击 一般的自然灾难 以及其他相当危害程度的威胁所造成的重要资源损害 能够发现重要的安全漏洞和处置安全事件 在自身遭到损害后 能够在一段时间内恢
  • computer vision一些术语-目标识别、目标检测、目标分割、语义分割等

    object recognition目标识别 object detection目标检测 Object Segmentation目标分割 Image Segmentation图像分割 semantic segmentation语义分割 ins
  • 【计算机视觉

    文章目录 一 分割 语义相关 6篇 1 1 Semantic Image Synthesis via Class Adaptive Cross Attention 1 2 Semi supervised Domain Adaptation