注意力机制代码_pytorch中加入注意力机制（CBAM），以ResNet为例

2023-05-16

对于注意力机制的个人理解：

网络越深、越宽、结构越复杂，注意力机制对网络的影响就越小。
在网络中加上CBAM不一定带来性能上的提升，对性能影响因素有数据集、网络自身、注意力所在的位置等等。
建议直接在网络中加上SE系列，大部分情况下性能都会有提升的。

CBAM的解析：

heu御林军：CBAM：卷积注意力机制模块zhuanlan.zhihu.com

贴出一些和SE相关的：

初识CV：SE-Inception v3架构的模型搭建（keras代码实现）zhuanlan.zhihu.com PyTorch Hub发布！一行代码调用所有模型：torch.hubblog.csdn.net

源码位置：

初识CV：ResNet_CBAM源码zhuanlan.zhihu.com

第一步：找到ResNet源代码

在里面添加通道注意力机制和空间注意力机制

所需库

import torch.nn as nn
import math
try:
    from torch.hub import load_state_dict_from_url
except ImportError:
    from torch.utils.model_zoo import load_url as load_state_dict_from_url
import torch

通道注意力机制

class ChannelAttention(nn.Module):
    def __init__(self, in_planes, ratio=16):
        super(ChannelAttention, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.max_pool = nn.AdaptiveMaxPool2d(1)

        self.fc1   = nn.Conv2d(in_planes, in_planes // 16, 1, bias=False)
        self.relu1 = nn.ReLU()
        self.fc2   = nn.Conv2d(in_planes // 16, in_planes, 1, bias=False)

        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = self.fc2(self.relu1(self.fc1(self.avg_pool(x))))
        max_out = self.fc2(self.relu1(self.fc1(self.max_pool(x))))
        out = avg_out + max_out
        return self.sigmoid(out)

空间注意力机制

class SpatialAttention(nn.Module):
    def __init__(self, kernel_size=7):
        super(SpatialAttention, self).__init__()

        assert kernel_size in (3, 7), 'kernel size must be 3 or 7'
        padding = 3 if kernel_size == 7 else 1

        self.conv1 = nn.Conv2d(2, 1, kernel_size, padding=padding, bias=False)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        avg_out = torch.mean(x, dim=1, keepdim=True)
        max_out, _ = torch.max(x, dim=1, keepdim=True)
        x = torch.cat([avg_out, max_out], dim=1)
        x = self.conv1(x)
        return self.sigmoid(x)

在ResNet网络中添加注意力机制

注意点：因为不能改变ResNet的网络结构，所以CBAM不能加在block里面，因为加进去网络结构发生了变化，所以不能用预训练参数。加在最后一层卷积和第一层卷积不改变网络，可以用预训练参数

class ResNet(nn.Module):

    def __init__(self, block, layers, num_classes=1000, zero_init_residual=False,
                 groups=1, width_per_group=64, replace_stride_with_dilation=None,
                 norm_layer=None):
        super(ResNet, self).__init__()
        if norm_layer is None:
            norm_layer = nn.BatchNorm2d
        self._norm_layer = norm_layer

        self.inplanes = 64
        self.dilation = 1
        if replace_stride_with_dilation is None:
            # each element in the tuple indicates if we should replace
            # the 2x2 stride with a dilated convolution instead
            replace_stride_with_dilation = [False, False, False]
        if len(replace_stride_with_dilation) != 3:
            raise ValueError("replace_stride_with_dilation should be None "
                             "or a 3-element tuple, got {}".format(replace_stride_with_dilation))
        self.groups = groups
        self.base_width = width_per_group
        self.conv1 = nn.Conv2d(3, self.inplanes, kernel_size=7, stride=2, padding=3,
                               bias=False)
        self.bn1 = norm_layer(self.inplanes)
        self.relu = nn.ReLU(inplace=True)

        # 网络的第一层加入注意力机制
        self.ca = ChannelAttention(self.inplanes)
        self.sa = SpatialAttention()

        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        self.layer1 = self._make_layer(block, 64, layers[0])
        self.layer2 = self._make_layer(block, 128, layers[1], stride=2,
                                       dilate=replace_stride_with_dilation[0])
        self.layer3 = self._make_layer(block, 256, layers[2], stride=2,
                                       dilate=replace_stride_with_dilation[1])
        self.layer4 = self._make_layer(block, 512, layers[3], stride=2,
                                       dilate=replace_stride_with_dilation[2])
        # 网络的卷积层的最后一层加入注意力机制
        self.ca1 = ChannelAttention(self.inplanes)
        self.sa1 = SpatialAttention()

        self.avgpool = nn.AdaptiveAvgPool2d((1, 1))
        self.fc = nn.Linear(512 * block.expansion, num_classes)

        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
            elif isinstance(m, (nn.BatchNorm2d, nn.GroupNorm)):
                nn.init.constant_(m.weight, 1)
                nn.init.constant_(m.bias, 0)

        # Zero-initialize the last BN in each residual branch,
        # so that the residual branch starts with zeros, and each residual block behaves like an identity.
        # This improves the model by 0.2~0.3% according to https://arxiv.org/abs/1706.02677
        if zero_init_residual:
            for m in self.modules():
                if isinstance(m, Bottleneck):
                    nn.init.constant_(m.bn3.weight, 0)
                elif isinstance(m, BasicBlock):
                    nn.init.constant_(m.bn2.weight, 0)

    def _make_layer(self, block, planes, blocks, stride=1, dilate=False):
        norm_layer = self._norm_layer
        downsample = None
        previous_dilation = self.dilation
        if dilate:
            self.dilation *= stride
            stride = 1
        if stride != 1 or self.inplanes != planes * block.expansion:
            downsample = nn.Sequential(
                conv1x1(self.inplanes, planes * block.expansion, stride),
                norm_layer(planes * block.expansion),
            )

        layers = []
        layers.append(block(self.inplanes, planes, stride, downsample, self.groups,
                            self.base_width, previous_dilation, norm_layer))
        self.inplanes = planes * block.expansion
        for _ in range(1, blocks):
            layers.append(block(self.inplanes, planes, groups=self.groups,
                                base_width=self.base_width, dilation=self.dilation,
                                norm_layer=norm_layer))

        return nn.Sequential(*layers)

    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)

        x = self.ca(x) * x
        x = self.sa(x) * x

        x = self.maxpool(x)

        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)

        x = self.ca1(x) * x
        x = self.sa1(x) * x


        x = self.avgpool(x)
        x = x.reshape(x.size(0), -1)
        x = self.fc(x)

        return x

请详细阅读代码加的位置：

 # 网络的第一层加入注意力机制
 self.ca = ChannelAttention(self.inplanes)
 self.sa = SpatialAttention()

和

# 网络的卷积层的最后一层加入注意力机制
self.ca1 = ChannelAttention(self.inplanes)
self.sa1 = SpatialAttention()

forWord部分代码

x = self.ca(x) * x
x = self.sa(x) * x

x = self.maxpool(x)

x = self.layer1(x)
x = self.layer2(x)
x = self.layer3(x)
x = self.layer4(x)

x = self.ca1(x) * x
x = self.sa1(x) * x

请大家详细阅读，一定能看懂的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

CBAM

resnet

注意力机制代码

中加入注意力机制

注意力机制代码_pytorch中加入注意力机制（CBAM），以ResNet为例的相关文章

Win10 64位上CUDA 12的PyTorch安装

我需要在我的 PC 上安装 PyTorch 其 CUDA 版本 12 0 pytorch 2 的表 https i stack imgur com X13oS png in In 火炬网站 https pytorch org get sta
无法将 cuda:0 设备类型张量转换为 numpy。首先使用 Tensor.cpu() 将张量复制到主机内存

我试图展示 GAN 网络在某些指定时期的结果打印当前结果的功能之前是在 TF 中使用的我需要换成pytorch def show result G net z num epoch show False save False path r
Pytorch 数据加载器：错误的文件描述符和 EOF > 0

问题描述在使用由自定义数据集制作的 Pytorch 数据加载器进行神经网络训练期间我遇到了奇怪的行为数据加载器设置为workers 4 pin memory False 大多数时候训练都顺利完成有时训练会随机停止并出现以下错误
PyTorch - 参数不变

为了了解 pytorch 的工作原理我尝试对多元正态分布中的一些参数进行最大似然估计然而它似乎不适用于任何协方差相关的参数所以我的问题是为什么这段代码不起作用 import torch def make covariance ma
如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
我可以使用逻辑索引或索引列表对张量进行切片吗？

我正在尝试使用列上的逻辑索引对 PyTorch 张量进行切片我想要与索引向量中的 1 值相对应的列切片和逻辑索引都是可能的但是它们可以一起吗如果是这样怎么办我的尝试不断抛出无用的错误类型错误使用 ByteTensor 类型的
为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
torch-1.1.0-cp37-cp37m-win_amd64.whl 在此平台上不受支持的滚轮

我在开发 RNN 时需要使用 pyTorch 每当我尝试安装它时我都会收到一条错误消息指出 torch 1 1 0 cp37 cp37m win amd32 whl 在此平台上不受支持 pip3安装https download pyto
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
PyTorch 中复数矩阵的行列式

有没有办法在 PyTorch 中计算复矩阵的行列式 torch det未针对 ComplexFloat 实现不幸的是目前尚未实施一种方法是实现您自己的版本或简单地使用np linalg det 这是一个简短的函数它计算我使用 LU
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
BertForSequenceClassification 是否在 CLS 向量上进行分类？

我正在使用抱脸变压器 https huggingface co transformers index html使用 PyTorch 打包和 BERT 我正在尝试进行 4 向情感分类并正在使用BertFor序列分类 https hugging
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da

随机推荐

python多线程实现异步_python多线程实现异步

import time from threading import Thread def long io cb def func callback print 34 开始耗时操作io 34 time sleep 5 print 34 io耗
getopt函数理解

getopt函数定义如下 include lt unistd h gt int getopt int argc char const argv const char optstring 相关的变量 extern char optarg ex
登录界面ui设计_UI界面的进度条设计！

进度条也被称为进度指示器向导剩余步骤通俗来讲 xff0c 进度条即程序在处理任务时 xff0c 实时的以图形形式显示处理任务进度速度剩余未完成量的界面元素一般以长条状呈现进度条可以让用户预估整个处理流程的速度状态 xff0c
python十六进制运算_十六进制字符串hexstr的计算

在面向比较底层的编程时 xff0c 界面和接口常常需要显示十六进制字符串 hexstr hexstr只包含0 9a f的字符 xff0c 本文汇总一些能够得到hexstr的计算方法 hex函数 hex函数是builtin的 xff0c 随手
python输入一串字符作为密码_Python字符串、集合练习_密码校验

校验密码是否合法 xff1a 1 输入一个密码要求长度在5 10位 xff1a len 2 密码里面必须包含 xff1a 大写字母 xff0c 小写字母和数字 xff1a 字符串方法或者集合 3 最多输入5次 xff1a for 用字符串方
ideaskin软件下载_Idea for android app

App idea generator free app for inspiring and giving idea to make an app This app will show three random words on the sc
西门子实数转整数_西门子PLC模拟量输入输出相关数据类型转换

PLC模拟量输入输出都会涉及到数据类型的互转问题 xff0c 然而西门子300系统对于数据格式有着明确的规定 xff0c 一般的四则运算都是在同一数据类型下才能进行的 xff0c 这也是一直以来困扰初学者的一个问题西门子300编程软件st
python所有单词首字母大写_在Python中将每个单词的首字母大写

在这里我们正在实现一个python程序来大写字符串中每个单词的首字母示例 Input nbsp HELLO nbsp WORLD Output nbsp Hello nbsp World 方法1 使用 title 方法 python程序
怎样选择虚拟服务器,怎样选择虚拟服务器

怎样选择虚拟服务器内容精选换一换由于通用型内存优化型II代的云服务器与通用型内存优化型I代的云服务器具有不同的虚拟化架构和不同的驱动类型 xff0c 所以通用型内存优化型I代云服务器创建的私有镜像需要经过优化才能用来创建II代云
绝地求生信号枪在什么服务器,绝地求生信号枪在哪捡绝地求生信号枪怎么用/有什么用...

本文导航第1页 xff1a 绝地求生信号枪有什么用怎么得绝地求生信号枪有什么用怎么得绝地求生信号枪在哪捡绝地求生信号枪怎么用有什么用 xff0c 除了追加表情动作系统与好友列表之外 xff0c 海外玩家意外发现在自定义游戏 C
服务器系统centos故障,服务器意外死机/centos7系统/提示内核故障/kernel: ERST: Can not request iomem region...

今天易秋网络老易遇到一个问题 xff0c 独立服务器意外死机 xff0c 显示内核有问题 xff0c 具体虽然还是没搞明白 xff0c 顺便找了找网上的教程 xff0c 大概是修改内核启动项grub xff0c 添加一个设置 xff0c 具
python爬虫怎么登陆_python爬虫scrapy之登录知乎

下面我们看看用scrapy模拟登录的基本写法 xff1a 注意 xff1a 我们经常调试代码的时候基本都用chrome浏览器 xff0c 但是我就因为用了谷歌浏览器它总是登录的时候不提示我用验证码 xff0c 误导我以为登录时不需要验证码
rpm命令的查询模式常用方式举例

rpm命令的查询模式语法 xff1a rpm q query select options query options 表示必选部分 xff0c 表示可选部分其中 xff1a select options表示查询的范围 xff0c 比如
ubuntu不接显示器无法开机_电脑无法开机怎么办？

电脑故障千奇百怪 xff0c 其中最令人头疼的一定是无法开机导致电脑无法开机的原因太多了 xff0c 但又一时很难判断原因 xff0c 遇到急需用电脑的更是令人烦躁那么我们如果遇到电脑无法开机的问题应该怎么办呢 xff1f 这里会提供一
android 软件调用c库,Android调用第三方C++算法库

背景现在越来越多应用包含一些第三方C C 43 43 算法库比如图像处理人脸检测语音识别等等第三方提供的算法库都是C C 43 43 动态库 so 不同的提供商提供的接口存在差异主要分为以下两种提供Java接口和so库这种类
嵌入式linux头文件,常用头文件和功能

96 96 96 与体系结构相关的 xff1a 4个 h 头文件 include asm 这些头文件主要定义了一些与 CPU 体系结构密切相关的数据结构宏函数和变量 xff1a I O 头文件 xff0c 以宏的嵌入汇编程序形式定义对 I
vscode 怎么让光标一下子跳到行尾部_解放生产力！20 个必知必会 VSCode 小技巧

这篇文章旨在帮助使用 VS Code 的人能够更快速的开发 xff0c 不是每个人都有时间去研究每一个提示和技巧 xff0c 去发现帮助他们更快开发的那一个因为太多了所以我会列出我最喜欢用的可以使我快速开发的快捷键 1 合并为一行 On
无向图的顶点的度怎么算_数据结构习题解答：图 | 选择题

61 61 61 Tips 点击上方蓝字关注 xff0c 分类速查更多信息 61 61 61 1 xff0e 在一个有向图中 xff0c 所有顶点的入度之和等于所有顶点的出度之和的 B 倍 A xff0e 1 2 B xff0e 1 C
运行快捷指令_快捷指令自动化运行需解锁？这些细节你需要了解一下

通过之前的几篇文章 xff0c 我们已经了解了快捷指令自动化的基本玩法但有些小伙伴在设置自动化后总没有达到理想的效果 xff0c 比如触发自动化后需要手动点击 xff0c 再或者运行时需要解锁手机接下来通过三个部分来讲解自动化都有哪些设
注意力机制代码_pytorch中加入注意力机制（CBAM），以ResNet为例

对于注意力机制的个人理解 xff1a 网络越深越宽结构越复杂 xff0c 注意力机制对网络的影响就越小在网络中加上CBAM不一定带来性能上的提升 xff0c 对性能影响因素有数据集网络自身注意力所在的位置等等建议直接在网络中加上