图像分割之Unet解析及实现代码

2023-11-05

论文连接: https://arxiv.org/pdf/1505.04597.pdf

源码连接: https://github.com/FENGShuanglang/unet

图像分割

图像分割就是把图像分成若干个特定的、具賄独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像素赋予相同的编号。

在这里插入图片描述

Unet网络结构详解

Unet网络结构:

在这里插入图片描述
该网络结构主要分为三部分:下采样, 上采样以及 跳跃连接。首先将该网络分为左右部分来分析,左边是压缩的过程,即Encoder。通过卷积和下采样来降低图像尺寸,提取一些浅显的特征。 右边Decoder是解码的过程。 通过卷积和上采样来获取一些深层次的特征。其中卷积采用的无填充方式来保证结果都是基于没有缺失上下文特征得到的,因此每次经过卷积后,图像的大小会减小。中间通过concat的方式,将编码阶段获得的feature map同解码阶段获得的feature map结合在-起,结合深层次和浅层次的特征,得到更加精细的细节,根据得到的feature map进行预测分割。要注意的是这里两层的feature map大小不同,因此需要经过切割。最后通过1x1的卷积做分类。

overlap-tile 策略

该策略的思想是:对图像的某一块像点(黄框内部分)进行预测时,要该图像块周围的像素点(色框内)提供上下文信息
(context) ,以获得更准确的预测。
在这里插入图片描述
医学图像是一般相当大, 但是分割时候不可能将原图太小输入网络,所以必须切成一张一 张的小patch, 在切成小patch的时候,Unet由于网络结构原因适合有overlap的切图,可以看图,红框是要分割区域,但是在切图时要包含周围区域,overlap另- 个重要原因是周围overlap部分可以为分割区域边缘部分提供文理等信息。可以看黄框的边缘,分割结果并没有受到切成小patch而造成分割情况不好。

损失函数

在这里插入图片描述
ak(x)表示像素x在特征图中的第k层的激活值,
k表示是第几个特征通道,
x表示像素点,
K表示类别的个数。
在这里插入图片描述
l: S2→{…,K.} 每个像素的真实标签

在这里插入图片描述
表示训练构成中像素点的重要权重
W0 表示平衡类别频率的权重图,
d1 表示此像素点到离它最近cel边界的距离,
d2 表示此像素点到离他第二近ell边界的距离。

实现代码(python)

环境:pytorch 1.0以上。可直接运行

""" Full assembly of the parts to form the complete network """
"""Refer https://github.com/milesial/Pytorch-UNet/blob/master/unet/unet_model.py"""

import torch
import torch.nn as nn
import torch.nn.functional as F


class UNet(nn.Module):
    def __init__(self, n_channels, n_classes, bilinear=True):
        super(UNet, self).__init__()
        self.n_channels = n_channels
        self.n_classes = n_classes
        self.bilinear = bilinear

        self.inc = DoubleConv(n_channels, 64)
        self.down1 = Down(64, 128)
        self.down2 = Down(128, 256)
        self.down3 = Down(256, 512)
        self.down4 = Down(512, 512)
        self.up1 = Up(1024, 256, bilinear)
        self.up2 = Up(512, 128, bilinear)
        self.up3 = Up(256, 64, bilinear)
        self.up4 = Up(128, 64, bilinear)
        self.outc = OutConv(64, n_classes)

    def forward(self, x):
        x1 = self.inc(x)
        x2 = self.down1(x1)
        x3 = self.down2(x2)
        x4 = self.down3(x3)
        x5 = self.down4(x4)
        x = self.up1(x5, x4)
        x = self.up2(x, x3)
        x = self.up3(x, x2)
        x = self.up4(x, x1)
        logits = self.outc(x)
        return logits
class DoubleConv(nn.Module):
    """(convolution => [BN] => ReLU) * 2"""

    def __init__(self, in_channels, out_channels):
        super().__init__()
        self.double_conv = nn.Sequential(
            nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(inplace=True),
            nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1),
            nn.BatchNorm2d(out_channels),
            nn.ReLU(inplace=True)
        )

    def forward(self, x):
        return self.double_conv(x)


class Down(nn.Module):
    """Downscaling with maxpool then double conv"""

    def __init__(self, in_channels, out_channels):
        super().__init__()
        self.maxpool_conv = nn.Sequential(
            nn.MaxPool2d(2),
            DoubleConv(in_channels, out_channels)
        )

    def forward(self, x):
        return self.maxpool_conv(x)


class Up(nn.Module):
    """Upscaling then double conv"""

    def __init__(self, in_channels, out_channels, bilinear=True):
        super().__init__()

        # if bilinear, use the normal convolutions to reduce the number of channels
        if bilinear:
            self.up = nn.Upsample(scale_factor=2, mode='bilinear', align_corners=True)
        else:
            self.up = nn.ConvTranspose2d(in_channels // 2, in_channels // 2, kernel_size=2, stride=2)

        self.conv = DoubleConv(in_channels, out_channels)

    def forward(self, x1, x2):
        x1 = self.up(x1)
        # input is CHW
        diffY = torch.tensor([x2.size()[2] - x1.size()[2]])
        diffX = torch.tensor([x2.size()[3] - x1.size()[3]])

        x1 = F.pad(x1, [diffX // 2, diffX - diffX // 2,
                        diffY // 2, diffY - diffY // 2])

        x = torch.cat([x2, x1], dim=1)
        return self.conv(x)


class OutConv(nn.Module):
    def __init__(self, in_channels, out_channels):
        super(OutConv, self).__init__()
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size=1)

    def forward(self, x):
        return self.conv(x)
if __name__ == '__main__':
    net = UNet(n_channels=3, n_classes=1)
    print(net)

本人在读研一,如果有想要学习的神经网络模型,可以私信我,会尽快更新。喜欢点个赞吧,多谢支持!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

图像分割之Unet解析及实现代码 的相关文章

随机推荐

  • Dictionary用法总结

    说明 必须包含名空间System Collection Generic Dictionary里面的每一个元素都是一个键值对 由二个元素组成 键和值 键必须是唯一的 而值不需要唯一的 键和值都可以是任何类型 比如 string int 自定义
  • 嵌入式硬件 入门路线

    嵌入式硬件 入门路线 文章目录 嵌入式硬件 入门路线 前言 C语言 推荐学习方法 推荐资料 51单片机 学习51单片机的收获 推荐学习方法 推荐资料 学习成本 stm32单片机 前置知识需求 推荐学习法 推荐资料 学习线路推荐说明 学习成本
  • matlab的详细使用方法

    help命令 格式help 函数名 例 局部上 1 help plot 二维绘图 2 help elfun 基本函数 初等函数的帮助 3 help exp 指数函数的简单帮助 4 网页格式的帮助doc exp 5 Lookfor 模糊查询
  • vscode连接远程服务器+SFTP同步本地文件

    vscode连接远程服务器 SFTP同步本地文件 前言 准备工作 配置远程服务器 SFTP 前言 最近在做毕设 本来使用的是kaggle的gpu资源 但是上传数据 修改数据实在不方便 于是向实验室学长要了一个单卡服务器 下面介绍如何使用vs
  • Android使用SharedPreferences(sp)存储基本数据类型、List集合、Map集合、对象都在这了

    基于一些小伙伴说在取出对象的时候出现null 这个问题可能是因为你的对象没有序列化的原因 如果存在内部类的也需要进行序列化 看下面的例子 public class Test implements Serializable 内部类 publi
  • c语言蛇形填充数组,蛇形

    题目描述 蛇形矩阵是由1开始的自然数依次排列成的一个矩阵上三角形 例如 当输入5时 应该输出的三角形为 1 3 6 10 15 2 5 9 14 4 8 13 7 12 11 请注意本题含有多组样例输入 输入描述 输入正整数N N不大于10
  • vue中使用简单的回调函数

    使用场景 比如 多个新增接口一样 只是新增之后调用的列表接口不一致 this getTalkBy 列表接口的回调 调用 this getAddTalkLike this getTalkBy 新增接口 getAddTalkLike callb
  • 大神总结的图像处理学习路线

    图像处理 第一阶段 熟悉图像算法 推荐中科院研究生院刘定生老师的数字图像处理与分析 视频 配套的书籍 冈萨雷斯版数字图像处理 同时用matlab软件 仿真每一个图像算法案例 推荐 matlab宝典 第二阶段 认真学习C 推荐 C Prime
  • 基于Smack3.0.4+ Openfire3.10.2开发之Android 客户端之四

    我们在之前依次介绍openfire部署以及smack常用API的使用 这一节中我们着力介绍如何基于asmack开发一个Android的客户端 本篇的重点在实践 讲解和原理环节 大家可以参考前面我所发布的OpenFire和Smack的相关文章
  • 10.JavaWeb-logback日志

    1 日志的概念 日志是用于记录软件系统运行时状态和事件的重要工具 在软件开发中 日志是一种常用的调试和故障排查手段 同时也可以用于性能分析 用户行为追踪和系统监控等方面 1 1日志特点 灵活性 可以根据需要配置日志的级别和输出目标 方便在不
  • MCU和DSP区别

    1 概述 随着处理器技术的不断发展 目前来看CPU Central Processing Unit 逐渐出现三种分支 分别是DSP Digital Signal Processing Processor 数字信号处理 以及MCU Micro
  • 第四天笔记

    1 盒子模型 内边距 应用于所有边 padding 1em 上边下边 左边右边 padding 5 10 上边 左边右边 下边 padding 1em 2em 2em 上边 右边 下边 左边 padding 5px 1em 0 2em 全局
  • JavaScript给URL追加参数

    代码 appendQuery url key value gt var options key if typeof options string options options key value options param options
  • 傅里叶变换在图像处理中的应用

    目录 基本概念 超详细的图像中傅里叶理解及常用模板 请参考 https blog csdn net m0 37264397 article details 70186390 应用一 使用C opencv对图像进行傅里叶变换 再根据频谱图对原
  • STM32----IIC详解

    一 IIC简介 1 IIC总线概述 IIC总线是飞利浦公司研发的两线制串行通信总线 IIC两线制包括 串行时钟线 SCL 和串行数据线 SDA 串行时钟线 SCL 只能由主器件控制 串行数据线 SDA 实现双向数据传输 IIC通信属于同步
  • 在IE中使用ActiveX控件,需要使用HTML中的标志是

    在 中使用ActiveX控件 需要使用HTML中的标志是
  • 【C语言】二分查找(含图解)

    文章目录 1 二分查找思想 2 代码实现 2 1 未封装函数 2 2 封装函数 使用while循环 2 3 封装函数 使用递归 1 二分查找思想 二分法 二分查找算法是一种在有序数组中查找某一特定元素的搜索算法 其思想就是不断地将有序查找表
  • 5.2 可变参数

    5 2 可变参数 Lua函数可以接受可变数目的参数 和C语言类似在函数参数列表中使用三点 表示函数有可变的参数 Lua将函数的参数放在一个叫arg的表中 除了参数以外 arg表中还有一个域n表示参数的个数 例如 我们可以重写print函数
  • JAVA根据模板生成PDF文件并导出

    JAVA根据模板生成并导出PDF 实现功能 根据模板生成PDF文件 模板文件参数可配 可手动修改 一 PDF导出效果 先看一下导出的demo文件 具体样式可手动修改 下图为demo pdf ftl导出PDF文件 下图为list pdf ft
  • 图像分割之Unet解析及实现代码

    Unet解析及实现代码 论文连接 https arxiv org pdf 1505 04597 pdf 源码连接 https github com FENGShuanglang unet 图像分割 Unet网络结构详解 Unet网络结构 o