【干货】生成对抗网络GANs算法在医学图像领域应用总结

2023-05-16

Goodfellow等人,介绍了生成对抗网络(GAN)以模拟数据分布。由于与两个基本属性相关的原因,GAN可以合成真实图像。

GAN是一种无监督的训练方法,可以通过类似于人类学习图像特征的方式获取信息。

通过发现潜在的高维数据分布,GAN在特征提取方面具有良好的性能。

本文回顾了医学图像处理应用中提出的基于GAN的结构,包括去噪,重建,分割,检测,分类和图像合成。论文的分布如图1所示。

本文最后汇总了63篇论文,涵盖了各种GAN。在第3节中,介绍了GAN的体系结构及其医学图像应用的子类。第4节描述了医学图像处理应用中GAN的不同贡献(去噪,重建,分割,检测,分类和合成)。第5节介绍了使用GAN进行医学图像处理的研究方法,挑战和未来。方向。

监督深度学习是目前许多计算机视觉和医学图像分析任务中最先进的技术。但是,它的主要限制因素是它依赖于大量带注释的训练数据。这在医学领域尤其重要,因为医学图像的获取和标记需要专家,导致严重缺乏标签训练数据。

机器学习的另一个问题是对于一般任务(例如超分辨率,分割或图像到图像转换),必须手动设计相似性度量。传统的相似之处包括像素级损失,例如L1和L2距离,这两者都模糊了结果并且缺乏上下文整合。GAN的对抗性训练通过学习丰富的相似度来区分真假数据,从而消除了对显式像素级目标函数建模的需要。该特征最近已被用于改进医学图像分割,图像增强(例如去噪),以及使用基于GAN的图像到图像转换技术来解决医学图像域移位的问题。

域转移现象实际上是另一个主要问题,目前限制了深度学习模型的泛化能力。假设训练数据和推理数据来自相同的分布,因此训练的模型也应该在看不见的数据上正常工作。这种假设通常不正确,并限制了模型的应用。性别。领域适应是指使模型对这种领域转变具有鲁棒性,而对抗训练具有巨大的潜力。

GAN框架由生成器(G),鉴别器(D)和实际数据X的训练数据集组成.G生成器是多层网络参数θG,其被设计用于找到映射x = G(z,θG)。通过映射生成G,并生成G. 另一方面,鉴别器D(x;θD)旨在将伪样本与真实数据区分开。

GAN的主要优点是通过关注数据的潜在概率密度来找到模型的数据分布。尽管GAN具有相对于CNN的固有优势,但仍存在一些挑战:

模式崩溃:当G崩溃时,将所有不同的输入映射到相同的数据;

不稳定:使相同的输入产生不同的输出。这些现象的主要原因与优化过程中梯度的消失有关。

虽然批量标准化是解决GAN不稳定性的一种方法,但是不足以实现GAN性能的最佳稳定性。因此,已经引入了许多GAN子类来解决这些缺陷。部分框架如下所示:

在医学图像处理中的应用

1,去噪

由于过量辐射对健康有害,减少辐射剂量已被用作有效的解决方案。然而,剂量减少会增加医学图像的噪声水平,这可能导致一些信息的丢失。当前基于CNN的去噪方法的主要问题是在优化中使用均方误差,导致预测图像模糊,这不能提供常规剂量图像的纹理质量。GAN可以通过检测噪声图像和去噪图像之间的映射来消除该问题并生成图像。

表1总结了主要的基于GAN的去噪方法。通过控制损失函数以考虑更多纹理特征,实现了良好的医学图像降噪性能。然而,找到快速,准确和稳定的架构是未来工作的开放方向。

2,重建

重建丢失的图像数据在诊断过程中可能是有效的。由于GAN在数据合成中的良好性能,它具有相当大的潜力。在一些医学图像中,例如磁共振成像(MRI),需要更长的采集时间,并且患者的无意识(即,由于呼吸)和自主(即由于不舒适的条件)运动是非常常见的。这些移动导致图像中的一些关键信息丢失。基于GAN的方法试图找到不完整(零填充)和完全采样的MR图像之间的映射。

表2和表3总结了一些GAN的特性和性能。在医学图像的重建中,GAN似乎提供了良好的性能,为损失功能添加了一些操作,突出了纹理细节和特殊功能。

3. 分割

医学图像处理中的物体和器官的标记在异常检测和形状识别中起重要作用。此外,分段被定义为许多其他任务的预处理步骤,例如检测和分类。因此,自动分割已经引起了许多研究者的关注。近几十年来,自动分割是医学图像处理中应用深度学习中最常见的主题。

通常,基于CNN的分割方法使用像素丢失来学习像素之间的局部和全局关系。因此,需要统计建模方法,如条件随机场或统计形状模型来纠正其结果。尽管已经提出基于补片的CNN方法来解决该问题,但是这些方法需要在准确度和补丁大小之间进行权衡。已经提出了基于加权交叉熵损失的基于U-Net的架构,但是这些方法面临权重优化问题。因此除了减肥之外,还需要一般的损失来解决这个问题。GAN在医学图像中被分割,主要在脑,胸,眼,腹部,显微图像,心脏运动和脊柱中。表5至10总结了基于GAN的分割方法。从已知的DNN架构来看,U-Net和ResNet是最常用的网络,因为它们提供通用识别功能,并且可以用作基于GAN的分段模型中的生成器。

大脑

胸部

胸部X射线图像分割的主要障碍是图像质量差,局部伪影和心肺重叠。戴等人。提出了一种基于GAN的解决方案(SCAN),可以增强分割的整体一致性,并提取心脏和左/右肺的轮廓。这项工作的主要贡献是使用完全连接的网络,其中VGG下采样路径的特征映射较少。

眼睛

在视网膜血管分割中,许多基于CNN的方法比人类专家表现得更好。Son等人。用GAN取代CNN,遵循发电机的U-Net架构。两个数据集的实验结果表明,传统鉴别器可以实现最佳性能,甚至优于人类专家的注释。

拉希里等人。提出了一种基于DC-GAN的分割方法,该方法将RoI补丁与背景分开。类似的CNN需要大量的训练数据才能很好地执行,并且所提出的结构使用九分之一的训练数据实现了类似的性能。

Shankaranarayana等。建议使用cGAN网络分割二维彩色眼底图像。发电机是防损和L1损耗的网络。

腹部

腹部MRI图像中脾脏的大小和形状的差异导致CNN深度分割方法的错误标记。GAN模型可以解决这个问题。

显微图像

脊柱

4.测试

在医学诊断中,许多疾病标志物被称为异常。然而,从图像计算检测异常需要大量的监督训练数据。即使有如此大量的数据,也无法保证学习网络能够检测到无形的情况。

与之前的应用相比,GAN在异常检测中提供的论文具有更多的结构复杂性,因为它们受益于GAN的不同方面。事实上,鉴别者的作用在实践中更为突出。此外,提取的地图定义了识别健康和异常图像的潜在方面,以便以更感性的方式使用。

5.分类

由于在心脏超声(US)成像期间发生心脏和呼吸运动,所得到的图像可能显示不完整的信息,例如心脏的基部和顶端切片,这是识别左心室(LV)解剖结构的关键特征。因此,需要自动化系统来完成缺失部分或丢弃具有不完整信息的图像,这可能误导分类过程。

张等人。提出了一种半耦合GAN(SCGAN)来对有用的心脏图像进行分类,其中缺少基础切片,如下图所示。结果表明,与CNN方法相比,该方法具有更高的精度和更低的计算成本。此外,SCGAN还提高了对抗训练的稳健性。

6.合成

最初,GAN被提议作为完全无监督的生成框架,其目标是在训练数据分布之后将随机噪声映射到真实图像。使用条件GAN,它成功地转变为监督生成框架。本文将原始GAN框架称为无条件或无监督GAN,而不是条件GAN。重要的是要强调区分这些不同的概念并相应地对文献进行分类是很重要的。

这两个框架的属性用于合成某些类型的医学图像,这些图像来自个体噪声或来自先前的知识(参见条件图像合成),例如元数据或甚至用于映射的图像数据。从一种形式到另一种形式的图像。

讨论

  1. GAN在医学领域的优势

基于GAN的深度生成模型可生成逼真的图像,而Gan在医学图像的两个独特挑战中具有独特的优势:

  • 标签的稀缺性:通常,标签过于昂贵且难以在医学图像中获得。基于监督学习的深度神经网络对于这些问题具有挑战性。通过综合和转换的多项研究证明,GAN可以利用这两个即将到来的框架。
  • 不成对数据:找到正确的数据(按像素或按地区)非常具有挑战性。GAN框架非常强大,例如循环GAN从未配对的训练图像中学习独特的模式并产生逼真的输出。

2,缺点

本文确定了当前形式的GAN中可能阻碍其在医学界发展的三个主要缺点:

  • 合成数据的可信度:基本网络 - 发生器和鉴别器仍然是深度神经网络,其机制尚未得到很好的研究。在医学图像中,强度通常与某些含义相关联,例如,可以基于CT数据的HU粗略地对组织类型进行分类。这种关联和映射目前在GAN重建中缺乏,这是一个足以让临床医生不信任GAN合成图像的缺点。
  • 不稳定的培训:许多文件表明GAN培训的价值不稳定。这可能导致模式cllaspe等情况。现有技术的工作集中在解决实际图像的GAN训练中的这些数值不稳定性问题。然而,在医学成像中,图像图案本身并不清楚,并且不清楚如何识别这样的问题。
  • 评估指标:评估重建结果的最佳方法仍不清楚。在医学成像中,研究人员主要依靠传统指标(如PSNR或MSE)来评估GAN重建的质量。但是,这个指标的缺点是人们选择GAN的主要原因。

3.未来前景

本文认为,GAN需要解决上述主要缺陷,才能成为医疗保健领域值得信赖的技术。

还需要解决训练不稳定性问题,这意味着需要进行严格的实验来理解GAN在医学成像环境中的融合。指标的问题很棘手,临床医生明白临床医生在CAD中合成GAN图像的表现是必要的第一步。简而言之,GAN在未来几年内开辟了许多可能的研究问题。正确的理解和回答是在实际临床情况下成功部署GAN的关键。

参考文献:关注微信公众号:“图像算法”或者微信搜索imalg_cn 可获取

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【干货】生成对抗网络GANs算法在医学图像领域应用总结 的相关文章

  • linux 安装后无法启动 修复引导grub

    1 查看磁盘信息 xff0c 确认系统安装在那个磁盘上 sudo df lh or sudo fdisk l 2 挂载 sudo mkdir mnt ubuntu 建立挂载点 sudo mount dev sda2 mnt ubuntu 挂
  • 在Ubuntu上快速安装Qt

    只需要一句话 xff0c Qt各个部件就可以快速安装好 xff0c 不需要麻烦的到官网上下载东西 当然 xff0c 安装速度取决于你的apt源的速度 xff0c 我用的华为源 xff0c 速度达到11MB S sudo apt instal
  • Argus camera API

    1 JETPACK CAMERA API LIBARGUS Advantage Open Standard Cross Platform Low level control of camera subsystem Frame based c
  • error: undefined reference to symbol '_ZN5boost6system15system_categoryEv

    使用boost时遇到下面error xff1a cmake version 3 5 1 usr bin ld CMakeFiles RGBD dir src ros rgbd cc o undefined reference to symb
  • ROS 使用signal 终止 Node

    在终端中使用ctrl 43 c可以强制终止运行的程序 xff0c 但有时需要在终止时作一些处理 xff08 如ros shotdown free等 xff09 xff0c 可使用信号函数作退出处理 头文件 include 34 csigna
  • flann error

    error usr include flann util serialization h 18 9 error class std unordered map lt unsigned int std vector lt unsigned i
  • 3个方法解决百度网盘限速

    转载自 lt 作者 xff1a 奔跑中的奶酪 原文链接 https www runningcheese com baiduyun gt 3个方法解决百度网盘限速 xff08 2019 06 20 更新 xff09 3个方法解决百度网盘限速
  • python 文件操作记录

    usr bin env python coding 61 utf 8 import os import shutil def getimagepath path file 61 open path data 61 file read lin
  • PCD格式保存

    coding utf 8 import time filename 61 34 1 txt 34 print 34 the input file name is r 34 filename start 61 time time print
  • 吴恩达机器学习笔记---持续更新

  • 边缘计算简介-1

  • 给Qt程序添加图片

    首先双击列表中的ui文件 xff0c 打开 设计器 然后从左侧列表拖一个 label 进去 然后右键点击 xff0c 出现菜单 xff0c 点击 改变样式表 然后在新出现的窗口里面输入image url 图片路径 jpg 比如 xff1a
  • 禁用win10自带的微软输入法!

    1 点击电脑主屏幕左下角开始图标 xff0c 选择设置 2 选择 时间和语言 gt 语言 gt 中文 3 单击选项 xff0c 删除微软拼音键盘即可 xff0c 这样就不会在不小心按到Ctrl 43 Shift建时 xff0c 出现切换输入
  • Office出现xukezheng问题,如何有效解决

    亲测有效哦 xff01 看原文原文出处 版本Office2019专业增强版
  • MatLab数据结构

    命名规则 xff1a 变量名区分大小写 必须以字母开头 xff0c 可以由字母 数字和下划线组成 xff0c 但不能使用标点 clc xff1a 清屏命令行窗口 clear all 清除工作区的变量 xff0c 但不清理命令行窗口 数据类型
  • MatLab矩阵运算

    1 矩阵构造及定义 A 61 1 3 5 7 8 9 构造多行矩阵 D 61 2 4 构造单行矩阵 B 61 1 2 9 最小值 xff1a 步长 xff1a 最大值 C 61 repmat D 4 3 将D的行重复四次 xff0c 列重复
  • MatLab补充

    1 matlab中所有的变量都是数组 x 61 4 实际是x数组 xff08 11大小 xff09 中存了4 y 61 6 9 是大小为12的数组存储y的数值 当您用空格 xff08 或逗号 xff09 分隔数值时 xff08 如前面的任务
  • MatLab使用注意事项

    1 在命令行输入指令 xff0c 当不加 xff1b 作为结尾时 xff0c 系统会在命令窗口输出数值 当使用 xff1b 作为命令结尾时 xff0c 系统不再输出数值 xff0c 但是会在工作区存储变量 对应的值 2 变量以字母开头 xf
  • EdgeCloudSim仿真实验平台使用介绍

    跑程序前的准备工作 xff1a Java环境配置 网上搜教程吧 xff0c 按着提示做就可以我使用的工具 xff1a Eclipse项目链接 xff1a 其中包含EdgeCloudSim英文说明文档和EdgeCloudSim工程文件夹 链接
  • 内存地址的应用

    学习python时真正了解了内存地址 cpu中的数据分类 cpu中的数据分为两类 xff1a 数据和指令 数据 xff1a 由指令产生的结果 指令 xff1a 键盘 鼠标等电脑输入设备操作以及人为对主机输入设备进行的目的性操作 值得注意的是

随机推荐

  • World插入图片显示不全

    在文档中直接插入图片 xff0c 显示不全 xff0c 具体的说是只能看到图片底部部分 给出两种办法解决 1 局部修改 把光标位置置于图片的末尾 xff0c 然后点击鼠标右键 xff0c 选择 段落 选项进入 段落 文本框 xff0c 选择
  • 快速消除Word文档中空格

    消除Word文档中的空格 0 待处理文档 1 选择文档的替换功能 2 选择 特殊格式 中的 段落标记p 3 设置成对应格式 4 选择全部替换 xff0c 效果如下 问题分析 xff1a 可以看出执行上述操作一次后 xff0c 相当于是扫描了
  • CCF推荐国际学术会议和期刊目录2019年

    链接 xff1a 全目录下载地址
  • 2022教资押题

    1 试题类型 2 具体文件夹 3 百度网盘链接 xff1a 链接 xff1a https pan baidu com s 17ZlLeE2E8Rzz7ELHptE8Fg 提取码 xff1a 9vky
  • 强化学习Q-learning入门教学

    1 问题描述 2 图形化展示 3 reward矩阵构建 4 Q表构建 这里需要说明的是Q表的转移规则原本是 xff1a 本例中为了方便介绍 xff0c 将 值设为1了 原文讲解的通俗易懂 xff0c 有兴趣的可以看一下 出处 xff1a h
  • 英文文献代码查找

    原文链接 xff1a https blog csdn net weixin 45656790 article details 109271019
  • Word中插入集合和元素的包含符号

    1 比较简单 xff0c 是元素和集合的包含关系 查找 xff1a word gt 插入 gt 符号栏下拉 xff0c 选择基础数学 2 集合间的包含关系 四个数字 xff0c 代表一个 输入文档中的指定位置 xff0c 选中数字以后 xf
  • 微信PC端聊天界面表情包无法显示

    我试成功的一个办法 xff0c 分享一下 具体步骤 xff1a 1 找到微信聊天界面的设置选项 xff0c 如图 2 进入微信文件保存位置 3 进入WeChat Files All Users config目录 4 删除config dat
  • MathType 提示需要一个新版本的MT Extra(True Type)字体

    1 打开C Windows Fonts文件夹 xff0c 若里面有MT Extra TrueType 字体或其快捷方式 xff0c 则将其删除 2 找到MathType安装目录下C Program Files x86 MathType Fo
  • Word快捷键设置上下标;Word取消表格虚线;Word查找数学符号

    问题1 快捷键设置上下角标 这个在论文写作时比较常用 xff0c 本人也是最近在写大论文 xff0c 遇到了这个情况 Word和Visio中 xff0c 都可以使用 步骤 xff1a 选中即将成为上下标的内容 xff0c 上标快捷键 xff
  • xcode中xib使用之轻松学习

    1 创建xib文件 在工程目录中New Files xff0c 选择user interface类型中的empty创建一个空的interface builder document文件 文件名没有强制的要求 xff0c 最好使用 前缀 xff
  • 用Opencv打造一台自动视觉目标跟踪系统

    平移 倾斜伺服装置 xff0c 帮助摄像机使用视觉自动跟踪颜色对象 简介 现在我们将使用我们的设备帮助相机自动跟踪颜色对象 xff0c 如下所示 xff1a OpenCV可免费用于学术和商业用途 它具有C 43 43 xff0c C xff
  • error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools"【转载+修改】

    error Microsoft Visual C 43 43 14 0 is required Get it with Microsoft Visual C 43 43 Build Tools http landinghub visuals
  • 如何使用OpenCV实现多张图像拼接

    先来看看OpenCV官方的例子得到效果是非常的好 xff0c 输入的images如下 xff1a 效果 xff1a Stitcher类与detail命名空间 OpenCV提供了高级别的函数封装在Stitcher类中 xff0c 使用很方便
  • 如何使用OpenCV对物体进行搜索检测与识别

    在本教程中 xff0c 我们将了解对象检测中称为 选择性搜索 的重要概念 我们还将用C 43 43 和Python共享OpenCV代码 物体检测与物体识别 对象识别算法识别图像中存在哪些对象 它将整个图像作为输入 xff0c 并输出该图像中
  • 一种基于深度学习的方法来检测摩托车头盔的使用

    背景 据统计使用摩托车头盔可以将道路交通事故中摩托车驾驶员致命伤害的可能性降低42 xff05 xff0c 尽管如此 xff0c 遵守摩托车头盔还是较少 xff0c 尤其是在发展中国家 xff0c 为了有效开展针对性的头盔使用运动 xff0
  • 偏振光相机1——偏振光

    光的电磁波属性 光是一种电磁波 xff0c 这个概念大家应该不陌生 既然是电磁波 xff0c 那我们从电磁波的特性上来看它有哪些属性 用图1中的交变电磁场来描述光的特性 xff0c 电场和磁场在空间中相互垂直 xff0c 它们同时与光的传播
  • 偏振光相机2——索尼大法

    Stokes参量 在上一篇 偏振光相机 偏振光 中 xff0c 我们知道偏振光有线性偏振光 椭圆偏振光 圆偏光 那么如何定量的描述偏振光呢 xff1f Stokes矢量是一种广泛用来描述偏振光属性的方法 图1 不同类型的偏振光 线性偏振光和
  • 偏振光相机3——偏振应用

    在之前的2篇中 xff0c 介绍了偏振光的基本概念和基于SONY最新CMOS偏振传感器芯片的相机 在本篇中 xff0c 我们来看看偏振相机的一些应用 偏振相机的应用离不开偏振光 xff0c 那么先看看如何得到偏振光信息 如何获取偏光 在 偏
  • 【干货】生成对抗网络GANs算法在医学图像领域应用总结

    Goodfellow等人 介绍了生成对抗网络 xff08 GAN xff09 以模拟数据分布 由于与两个基本属性相关的原因 xff0c GAN可以合成真实图像 GAN是一种无监督的训练方法 xff0c 可以通过类似于人类学习图像特征的方式获