【图像去雾】Contrastive Learning for Compact Single Image Dehazing阅读

2023-10-27

论文：https://arxiv.org/pdf/2104.09367.pdfhttps://arxiv.org/pdf/2104.09367.pdf

代码：https://github.com/GlassyWu/AECR-Nethttps://github.com/GlassyWu/AECR-Net

提出对比正则化；利用有雾图像和清晰图像的信息作为正负样本。确保恢复的图像远离模糊图像，而更接近清晰图像。此外，考虑到性能和内存存储之间的权衡，开发了一个基于类自动编码器(AE)框架的紧凑的dehazing网络。

adaptive mixup operation ：自适应的保存信息流；

Adaptive mixup enables the information of shallow features from the downsampling part adaptively flow to high-level features from the upsampling one, which is effective for feature preserving.

dynamic feature enhancement：扩大感受野，提高网络的转换能力。

主要贡献：

提出了新颖的ACER-Net，通过对比正则化和高度紧凑的自编码器类去雾网络，可以有效地生成高质量的无雾图像。与最先进的方法相比，AECR-Net实现了参数-性能的权衡。
该对比正则化作为一种通用的正则化，可以进一步提高各种最先进的去雾网络的性能。
所提出的类自编码器(AE)去雾网络中的自适应混合（adaptive mixup）和动态特征增强模块（dynamic feature enhancement）可以分别帮助去雾模型自适应地保持信息流，提高网络的转换能力。

其中 FA Block 来源于FFA-Net中的模块；与FFA-Net不同，显著减少了内存存储，以生成一个紧凑的去雾模型。论文中使用FA 模块作为AE （Autoencoder-like）网络的基本模块。

如上图Figure 3所示，AE-like 网络首先采用4x Downsampling模块，使用一个stride=1的卷积，和两个stride=2 的卷积实现；使密集的FA块在低分辨率空间中学习特征表示。

###### downsample
        self.down1 = nn.Sequential(nn.ReflectionPad2d(3),
                                   nn.Conv2d(input_nc, ngf, kernel_size=7, padding=0),
                                   nn.ReLU(True))
        self.down2 = nn.Sequential(nn.Conv2d(ngf, ngf*2, kernel_size=3, stride=2, padding=1),
                                   nn.ReLU(True))
        self.down3 = nn.Sequential(nn.Conv2d(ngf*2, ngf*4, kernel_size=3, stride=2, padding=1),
                                   nn.ReLU(True))

然后利用相应的4× Upsampling 和一个卷积生成恢复后的图像。请注意，这里仅使用6个FA块(与FFA-net中的57个FA块相比)，从而显著减少了FA块的数量。

        ###### upsample
        self.up1 = nn.Sequential(nn.ConvTranspose2d(ngf*4, ngf*2, kernel_size=3, stride=2, padding=1, output_padding=1),
                                 nn.ReLU(True))
        self.up2 = nn.Sequential(nn.ConvTranspose2d(ngf*2, ngf, kernel_size=3, stride=2, padding=1, output_padding=1),
                                 nn.ReLU(True))
        self.up3 = nn.Sequential(nn.ReflectionPad2d(3),
                                 nn.Conv2d(ngf, output_nc, kernel_size=7, padding=0),
                                 nn.Tanh())

FA模块结构图如下图：

FA Block 的代码：

class PALayer(nn.Module):
    def __init__(self, channel):
        super(PALayer, self).__init__()
        self.pa = nn.Sequential(
            nn.Conv2d(channel, channel // 8, 1, padding=0, bias=True),
            nn.ReLU(inplace=True),
            nn.Conv2d(channel // 8, 1, 1, padding=0, bias=True),
            nn.Sigmoid()
        )

    def forward(self, x):
        y = self.pa(x)
        return x * y

# 通道注意力模块 Channel Attention (CA) Layer
class CALayer(nn.Module):
    def __init__(self, channel):
        super(CALayer, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.ca = nn.Sequential(
            nn.Conv2d(channel, channel // 8, 1, padding=0, bias=True),
            nn.ReLU(inplace=True),
            nn.Conv2d(channel // 8, channel, 1, padding=0, bias=True),
            nn.Sigmoid()
        )

    def forward(self, x):
        y = self.avg_pool(x)
        y = self.ca(y)
        return x * y

# 参考FFA_Net
# 大多数图像去雾网络对通道和像素特征的处理是平等的，不能处理雾度分布不均匀和加权通道的图像。
# 提出的特征注意由通道注意和像素注意组成，这可以在处理不同类型的信息时提供额外的灵活性。
class DehazeBlock(nn.Module):
    def __init__(self, conv, dim, kernel_size, ):
        super(DehazeBlock, self).__init__()
        self.conv1 = conv(dim, dim, kernel_size, bias=True)
        self.act1 = nn.ReLU(inplace=True)
        self.conv2 = conv(dim, dim, kernel_size, bias=True)
        self.calayer = CALayer(dim)
        self.palayer = PALayer(dim)

    def forward(self, x):
        res = self.act1(self.conv1(x))
        res = res + x
        res = self.conv2(res)
        res = self.calayer(res)
        res = self.palayer(res)
        res += x
        return res

为了改善层间的信息流，融合更多的空间结构化信息，提出了两种不同的连接模式：（1）自适应混合，动态融合下采样层和上采样层之间的特征，以保持特征。（2）动态特征增强(DFE)模块通过融合更多的空间结构化信息来增强转换能力。

Figure 4 为Adaptive mixup 结构；

在图像去雾网络中，来自下采样层和上采样层的特征之间的连接缺失了，这导致了浅层特征（如边缘和角）的丢失。使用自适应混合操作来融合来自这两层的信息，以保持特征。如图Figure 4 所示。

在论文中，考虑两个下采样层和两个上采样层，这样混合操作的最终输出可以表述为：

Adaptive mixup 代码如下所示。其中w（公式中参数θ）是可学习的参数。

# Adaptive mixup
class Mix(nn.Module):
    def __init__(self, m=-0.80):
        super(Mix, self).__init__()
        w = torch.nn.Parameter(torch.FloatTensor([m]), requires_grad=True)
        w = torch.nn.Parameter(w, requires_grad=True)
        self.w = w
        self.mix_block = nn.Sigmoid()

    def forward(self, fea1, fea2):
        mix_factor = self.mix_block(self.w)
        out = fea1 * mix_factor.expand_as(fea1) + fea2 * (1 - mix_factor.expand_as(fea2))
        return out

图Figure 5 动态特征增强模块

引入可变形卷积动态特征增强模块(DFE)，以自适应形状扩展感受野，提高模型的转换能力，实现更好的图像去雾。使用了两个可变形的卷积层来使采样网格实现更自由形式的变形。如图Figure 3 黄色模块（DFE）所示。

Contrastive Regularization (对比正则化)

端到端的图像去雾方法，使用图像重建损失和正则化项来恢复图像。具体如下：

受对比学习（对于给定的锚点，对比学习的目标是将锚拉到接近正点附近，并将锚推离表示空间中的负点。）的影响，作者提出了一种新的对比正则化(CR)来生成更好的恢复图像。因此，需要考虑CR中的两个方面：一是构造“正”对和“负”对，二是找到这些对的潜在特征空间进行对比。

为简单起见，我们将恢复的图像、清晰图像和模糊图像分别称为Anchor、Positive、Negative。

于是公式（1）就可以变成公式（3）这种形式：

为了提高对比能力，我们从固定的预训练模型的不同层中提取了隐藏的特征。因此总体损失如公式（4）所示：

与CR相关的是感知损失（perceptual loss）。感知损失通过利用从预先训练过的深度神经网络中提取的多层特征来测量预测和ground truth之间的视觉差异。与正向正则化的感知损失不同，我们也采用有雾图像（去雾网络的输入）作为负图像来约束解空间。实验证明了CR对于图像去雾优于感知损失。

实验部分：

与SOTA方法对比:

消融实验：

完整代码：

import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.nn import init
import functools
from deconv import FastDeconv


def default_conv(in_channels, out_channels, kernel_size, bias=True):
    return nn.Conv2d(in_channels, out_channels, kernel_size, padding=(kernel_size // 2), bias=bias)

# https://blog.csdn.net/weixin_46773169/article/details/105462644
# Pixel Attention Layer

class PALayer(nn.Module):
    def __init__(self, channel):
        super(PALayer, self).__init__()
        self.pa = nn.Sequential(
            nn.Conv2d(channel, channel // 8, 1, padding=0, bias=True),
            nn.ReLU(inplace=True),
            nn.Conv2d(channel // 8, 1, 1, padding=0, bias=True),
            nn.Sigmoid()
        )

    def forward(self, x):
        y = self.pa(x)
        return x * y

# 通道注意力模块 Channel Attention (CA) Layer
class CALayer(nn.Module):
    def __init__(self, channel):
        super(CALayer, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.ca = nn.Sequential(
            nn.Conv2d(channel, channel // 8, 1, padding=0, bias=True),
            nn.ReLU(inplace=True),
            nn.Conv2d(channel // 8, channel, 1, padding=0, bias=True),
            nn.Sigmoid()
        )

    def forward(self, x):
        y = self.avg_pool(x)
        y = self.ca(y)
        return x * y

# 参考FFA_Net
# 大多数图像去雾网络对通道和像素特征的处理是平等的，不能处理雾度分布不均匀和加权通道的图像。
# 提出的特征注意由通道注意和像素注意组成，这可以在处理不同类型的信息时提供额外的灵活性。
class DehazeBlock(nn.Module):
    def __init__(self, conv, dim, kernel_size, ):
        super(DehazeBlock, self).__init__()
        self.conv1 = conv(dim, dim, kernel_size, bias=True)
        self.act1 = nn.ReLU(inplace=True)
        self.conv2 = conv(dim, dim, kernel_size, bias=True)
        self.calayer = CALayer(dim)
        self.palayer = PALayer(dim)

    def forward(self, x):
        res = self.act1(self.conv1(x))
        res = res + x
        res = self.conv2(res)
        res = self.calayer(res)
        res = self.palayer(res)
        res += x
        return res

# DCN 可变性卷积
from DCNv2.dcn_v2 import DCN  
class DCNBlock(nn.Module):
    def __init__(self, in_channel, out_channel):
        super(DCNBlock, self).__init__()
        self.dcn = DCN(in_channel, out_channel, kernel_size=(3,3), stride=1, padding=1).cuda()
    def forward(self, x):
        return self.dcn(x)


# Adaptive mixup
class Mix(nn.Module):
    def __init__(self, m=-0.80):
        super(Mix, self).__init__()
        w = torch.nn.Parameter(torch.FloatTensor([m]), requires_grad=True)
        w = torch.nn.Parameter(w, requires_grad=True)
        self.w = w
        self.mix_block = nn.Sigmoid()

    def forward(self, fea1, fea2):
        mix_factor = self.mix_block(self.w)
        out = fea1 * mix_factor.expand_as(fea1) + fea2 * (1 - mix_factor.expand_as(fea2))
        return out


class Dehaze(nn.Module):
    def __init__(self, input_nc, output_nc, ngf=64, use_dropout=False, padding_type='reflect'):
        super(Dehaze, self).__init__()

        ###### downsample
        self.down1 = nn.Sequential(nn.ReflectionPad2d(3),
                                   nn.Conv2d(input_nc, ngf, kernel_size=7, padding=0),
                                   nn.ReLU(True))
        self.down2 = nn.Sequential(nn.Conv2d(ngf, ngf*2, kernel_size=3, stride=2, padding=1),
                                   nn.ReLU(True))
        self.down3 = nn.Sequential(nn.Conv2d(ngf*2, ngf*4, kernel_size=3, stride=2, padding=1),
                                   nn.ReLU(True))

        ###### FFA blocks
        self.block = DehazeBlock(default_conv, ngf * 4, 3)

        ###### upsample
        self.up1 = nn.Sequential(nn.ConvTranspose2d(ngf*4, ngf*2, kernel_size=3, stride=2, padding=1, output_padding=1),
                                 nn.ReLU(True))
        self.up2 = nn.Sequential(nn.ConvTranspose2d(ngf*2, ngf, kernel_size=3, stride=2, padding=1, output_padding=1),
                                 nn.ReLU(True))
        self.up3 = nn.Sequential(nn.ReflectionPad2d(3),
                                 nn.Conv2d(ngf, output_nc, kernel_size=7, padding=0),
                                 nn.Tanh())


        self.dcn_block = DCNBlock(256, 256)

        self.deconv = FastDeconv(3, 3, kernel_size=3, stride=1, padding=1)

        self.mix1 = Mix(m=-1)
        self.mix2 = Mix(m=-0.6)

    def forward(self, input):

        x_deconv = self.deconv(input) # preprocess

        x_down1 = self.down1(x_deconv) # [bs, 64, 256, 256]
        x_down2 = self.down2(x_down1) # [bs, 128, 128, 128]
        x_down3 = self.down3(x_down2) # [bs, 256, 64, 64]

        x1 = self.block(x_down3)
        x2 = self.block(x1)
        x3 = self.block(x2)
        x4 = self.block(x3)
        x5 = self.block(x4)
        x6 = self.block(x5)

        x_dcn1 = self.dcn_block(x6)
        x_dcn2 = self.dcn_block(x_dcn1)

        x_out_mix = self.mix1(x_down3, x_dcn2)
        x_up1 = self.up1(x_out_mix) # [bs, 128, 128, 128]
        x_up1_mix = self.mix2(x_down2, x_up1)
        x_up2 = self.up2(x_up1_mix) # [bs, 64, 256, 256] 
        out = self.up3(x_up2) # [bs,  3, 256, 256]

        return out
        # 返回的是Figure 3 中的Anchor

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【图像去雾】Contrastive Learning for Compact Single Image Dehazing阅读的相关文章

无法使用 torch.Tensor 创建张量

我试图创建一个张量如下所示 import torch t torch tensor 2 3 我收到以下错误类型错误回溯最近调用最后在 gt 1 a torch tensor 2 3 类型错误 tensor 需要 1 个位置参数但
Pytorch 分析器显示两个不同网络的卷积平均执行时间不同

我有两个网络我正在对它们进行分析以查看哪些操作占用了大部分时间我注意到CUDA time avg为了aten conv2d不同网络的操作有所不同这也增加了一个数量级在我的第一个网络中它是22us 而对于第二个网络则是3ms 我的第
PyTorch - 参数不变

为了了解 pytorch 的工作原理我尝试对多元正态分布中的一些参数进行最大似然估计然而它似乎不适用于任何协方差相关的参数所以我的问题是为什么这段代码不起作用 import torch def make covariance ma
PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
为什么测试时一定要用DataParallel？

在GPU上训练 num gpus设置为1 device ids list range num gpus model NestedUNet opt num channel 2 to device model nn DataParallel m
删除 Torch 张量中的行

我有一个火炬张量如下 a tensor 0 2215 0 5859 0 4782 0 7411 0 3078 0 3854 0 3981 0 5200 0 1363 0 4060 0 2030 0 4940 0 1640 0 6025 0
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
为什么 pytorch matmul 在 cpu 和 gpu 上执行时得到不同的结果？

我试图找出 numpy pytorch gpu cpu float16 float32 数字之间的舍入差异而我发现的内容让我感到困惑基本版本是 a torch rand 3 4 dtype torch float32 b torch r
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0

随机推荐

解决Hololens2配置MRTK2.7版本官方教程中的一个问题

具体的配置可以参考官方的MRTK2 7配置教程 https docs microsoft com en us windows mixed reality develop unity tutorials mr learning base 02
配置qnx6.6中screen 环境变量

锋影 e mail 174176320 qq com 配置qnx6 6 中 screen 环境变量根据 Screen Graphics Subsystem Developer s Guide 总结停止 screen 进程 slay sc
plsql developer 通过ip链接数据库

数据库 ip 1521 sid 或 ip sid
oracle因为日志错误无法打开

今天在启动我得数据库时发现数据库只能mounted 无法打开提示错误今天在启动我得数据库时发现数据库只能mounted 无法打开提示错误 SQL gt select open mode from v database OPEN M
Docker Swarm集群搭建以及服务命令等操作

前言之前都是采用rancher可视化管理工具进行管理K8S进一步管理容器但是每次机器宕机后rancher中集群特别容易挂掉出现的问题五花八门在网上很难搜到解决方案所以准备采用docker官方集群管理平台Swarm管理容器一 do
The Reactive Manifesto（响应式宣言）

2019独角兽企业重金招聘Python工程师标准 gt gt gt 版本 2 0 2014 年 9 月 16 日发布在不同领域中深耕的组织都在不约而同地尝试发现相似的软件构建模式希望这些系统会更健壮更具回弹性更灵活也能更好地满足现
oracle 分区表详

转载自 http blog itpub net 31401608 viewspace 2147665 1 表空间及分区表的概念表空间是一个或多个数据文件的集合所有的数据对象都存放在指定的表空间中但主要存放的是表所以称作表空间分区
入站规则和出站规则_关于防火墙入站（inbound）出站（outbound）方式的解释

防火墙是一个重要的安全模块它能够限制网络的访问现在有一个要求那就是要让主机A能够访问主机B 主机B不能访问主机A 那么防火墙能够做到么答案是可以的当主机A的防火墙入站规则限制了主机B 那么主机B想访问主机A的时候发出的网络包确实会
Echart 地图开启缩放之后，中心点位置偏移

把 geo center 设为 undefined geo map china center undefined roam true
Nginx流控限制

Nginx流控流量限制 rate limiting 是Nginx中一个非常实用却经常被错误理解和错误配置的功能我们可以用来限制用户在给定时间内HTTP请求的数量请求可以是一个简单网站首页的GET请求也可以是登录表单的POST请求
.ajax表单校验插件,表单验证插件——validate

表单验证插件表单验证插件邮箱 function frmV validate 自定义验证规则 rules 错误提示位置 errorPlacement function error element error appendTo tip di
什么是用户增长？ (超详细)

一概况原因随着人口红利的衰减互联网流量红利的马太效应显现这意味着成本的大幅度增加企业必须改变过去粗放型的营销和运营方式用更高效更低成本实现快速增长定义通过实验和数据驱动聚焦整个用户生命周期的方法论在任何一家公司任何业
jetbrains全家桶

到期时间 19年6月份 SXXI7H41YN eyJsaWNlbnNlSWQiOiJTWFhJN0g0MVlOIiwibGljZW5zZWVOYW1lIjoicGF5bmUgd2FuZyIsImFzc2lnbmVlTmFtZSI6IiIsI
C++项目：高并发内存池

文章目录项目介绍什么是内存池池化技术内存池 malloc 页定长的内存池对比测试高并发内存池整体框架设计 thread cache 整体设计哈希桶映射对齐规则 TLS无锁访问 Central Cache Span SpanL
时分秒与时间戳相互转化（sys.argv）

import sys 把时分秒转化为时间戳 def countDown time s 0 hour time split 0 min time split 1 sec time split 2 s int hour 3600 int min
MKL的矩阵运算

矩阵与矩阵的乘法分为双精度的cblas sgemm和单精度的cblas sgemm 两个函数的参数意义一样只是类型不一样运算式 C alpha A B beta C 一般取alpha 1 0 beta 0 0 即计算式 C A B c
LateX环境安装与配置--包括常见安装失败错误更正（TeX Live 2021及TexStudio）

目录一前言二下载镜像文件 1 打开网址点击 On DVD 2 点击下载ISO镜像文件 3 选择一个最近的镜像网站进行下载 4 下载镜像文件 5 打开镜像文件三安装 1 修改安装内容及目录 2 出错问题 lt 1 gt 此电脑
pandas从mongo中导出数据存入excel或csv

import pandas as pd import pymongo mongo不带密码连接 con pymongo MongoClient ip mongo带密码连接 con pymongo MongoClient mongodb for
SQL_les0/基础知识/联合注入常用语句与相关技巧

SQL注入一种针对数据库的攻击方式危害数据被破坏数据被篡改原理攻击者通过构造不同的SQL语句来实现对数据库的操作常见数据库 Oracle SQL Server DB2 PostgreSQL MySQL Access 使用SQL
【图像去雾】Contrastive Learning for Compact Single Image Dehazing阅读

论文 https arxiv org pdf 2104 09367 pdfhttps arxiv org pdf 2104 09367 pdf 代码 https github com GlassyWu AECR Nethttps githu

【图像去雾】Contrastive Learning for Compact Single Image Dehazing阅读

【图像去雾】Contrastive Learning for Compact Single Image Dehazing阅读 的相关文章

随机推荐

热门标签

【图像去雾】Contrastive Learning for Compact Single Image Dehazing阅读的相关文章