Pytorch源码学习之四：torchvision.models.squeezenet

2023-05-16

0.介绍

Squeezenet网址
torchvision.model.squeeze官方文档
主要思想：堆叠Fire模块，每个Fire模块，分别采用1x1和3x3两个分支，最后做拼；，每个Fire的尺寸不变，channel数不变或增加；每个stage的Fire模块之间用nn.MaxPool2d进行下采样；使用卷积层代替FC层,channel数为类别数

1.源码

import torch
import torch.nn as nn
import torch.nn.init as init
from torch.hub import load_state_dict_from_url

__all__ = ['SqueezeNet', 'squeezenet1_0', 'squeezenet1_1']
model_urls = {
    'squeezenet1_0': 'https://download.pytorch.org/models/squeezenet1_0-a815701f.pth',
    'squeezenet1_1': 'https://download.pytorch.org/models/squeezenet1_1-f364aa15.pth',
}

class Fire(nn.Module): #Fire模块
    def __init__(self, inplanes, squeeze_planes, expand1x1_planes, expand3x3_planes):

        super(Fire, self).__init__()
        self.inplanes = inplanes
        self.squeeze = nn.Conv2d(inplanes, squeeze_planes, kernel_size=1)
        self.squeeze_activation = nn.ReLU(inplace=True)
        self.expand1x1 = nn.Conv2d(squeeze_planes, expand1x1_planes, kernel_size=1)
        self.expand1x1_activation = nn.ReLU(inplace=True)
        self.expand3x3 = nn.Conv2d(squeeze_planes, expand3x3_planes, kernel_size=3, padding=1)
        self.expand3x3_activation = nn.ReLU(inplace=True)
    def forward(self, x):
        x = self.squeeze(x)
        x = self.squeeze_activation(x)
        return torch.cat([
            self.expand1x1_activation(self.expand1x1(x)),
            self.expand3x3_activation(self.expand3x3(x))
        ], 1)

class SqueezeNet(nn.Module):

    def __init__(self, version='1.0', num_classes=1000):
        super(SqueezeNet, self).__init__()
        self.num_classes = num_classes
        if version == '1_0':
            self.features = nn.Sequential(
                nn.Conv2d(3, 96, kernel_size=7, stride=2),
                nn.ReLU(inplace=True),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(96, 16, 64, 64),
                Fire(128, 16, 64, 64),
                Fire(128, 32, 128, 128),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(256, 32, 128, 128),
                Fire(256, 48, 192, 192),
                Fire(384, 48, 192, 192),
                Fire(384, 64, 256, 256),
                nn.MaxPool2d(kernel_size=3, stride=2 ,ceil_mode=True),
                Fire(512, 64, 256, 256),
            )
        elif version == '1_1':
            self.features = nn.Sequential(
                nn.Conv2d(3, 64, kernel_size=3, stride=2),
                nn.ReLU(inplace=True),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(64, 16, 64, 64),
                Fire(128, 16, 64, 64),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(128, 32, 128, 128),
                Fire(256, 32, 128, 128),
                nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True),
                Fire(256, 48, 192, 192),
                Fire(384, 48, 192, 192),
                Fire(384, 64, 256, 256),
                Fire(512, 64, 256, 256),
            )
        else:
            raise ValueError("Unsupported SqueezeNet version {version}: 1_0 or 1_1 expected".format(version=version))
        #使用卷积代替全连接层
        final_conv = nn.Conv2d(512, self.num_classes, kernel_size=1)
        self.classifier = nn.Sequential(
            nn.Dropout(0.5),
            final_conv,
            nn.ReLU(inplace=True),
            nn.AdaptiveAvgPool2d((1,1))
        )
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                if m is final_conv:
                    init.normal_(m.weight, mean=0.0, std=0.01)
                else:
                    init.kaiming_uniform_(m.weight)
                if m.bias is not None:
                    init.constant_(m.bias, 0)
    def forward(self, x):
        x = self.features(x)
        x = self.classifier(x)
        return x.view(x.size(0), self.num_classes)

def _squeezenet(version, pretrained, progress, **kwargs):
    model = SqueezeNet(version, **kwargs)
    if pretrained:
        arch = 'squeezenet' + version
        state_dict = load_state_dict_from_url(model_urls[arch],
                                              progress=progress)
        model.load_state_dict(state_dict)
    return model

def squeezenet1_0(pretrained=False, progress=True, **kwargs):
    return _squeezenet('1_0', pretrained, progress, **kwargs)

def squeezenet1_1(pretrained=False, progress=True, **kwargs):
    return _squeezenet('1_1', pretrained, progress, **kwargs)

2.一些用法

2.1 torch.cat

torch.cat([
            self.expand1x1_activation(self.expand1x1(x)),
            self.expand3x3_activation(self.expand3x3(x))
        ], 1)
#按照第一个维度(channel维度)对[]内的Tensor进行拼接

2.2 nn.MaxPool2d()

nn.MaxPool2d(kernel_size=3, stride=2, ceil_mode=True)
class torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1,
                         return_indices=False, ceil_mode=False)
# kernel_size(int or tuple) - max pooling的窗口大小
#stride(int or tuple, optional) - max pooling的窗口移动的步长。默认值是kernel_size
#padding(int or tuple, optional) - 输入的每一条边补充0的层数
#dilation(int or tuple, optional) – 一个控制窗口中元素步幅的参数
#return_indices - 如果等于True，会返回输出最大值的序号，对于上采样操作会有帮助
#ceil_mode - 如果等于True，计算输出信号大小的时候，会使用向上取整，代替默认的向下取整的操作

2.3 使用全卷积代替全连接层

#使用全卷积代替FC层
self.classifier = nn.Sequential(
    nn.Dropout(0.5),
    final_conv,
    nn.ReLU(inplace=True),
    nn.AdaptiveAvgPool2d((1,1))
    )
def forward(self, x):
    x = self.features(x)
    x = self.classifier(x)
    return x.view(x.size(0), self.num_classes)
#即先采用AdaptiveAvgPool2D,将size变为1x1,channel数=num_classes,再做resize

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

torchvision

models

squeezenet

源码学习之四

Pytorch源码学习之四：torchvision.models.squeezenet 的相关文章

pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
RuntimeError：维度指定为 0 但张量没有维度

我试图使用 MNIST 数据集实现简单的 NN 但我不断收到此错误将 matplotlib pyplot 导入为 plt import torch from torchvision import models from torchvisi
运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
带代理的 extjs 树存储

我正在创建一个 MVC extjs 应用程序我有一个带有商店的树面板它正在从 php 源加载数据我收到以下 json 格式的响应 text Home leaf true dbName NULL children text Moje F
在pytorch张量中过滤数据

我有一个张量X like 0 1 0 5 1 0 0 1 2 0 我想实现一个名为的函数filter positive 它可以将正数据过滤成新的张量并返回原始张量的索引例如 new tensor index filter positive
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
django 查询所有相关集的过滤？

class Customer models Model name models CharField max length 200 class CustomerTicket models Model customer models OneTo
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
PyTorch 中复数矩阵的行列式

有没有办法在 PyTorch 中计算复矩阵的行列式 torch det未针对 ComplexFloat 实现不幸的是目前尚未实施一种方法是实现您自己的版本或简单地使用np linalg det 这是一个简短的函数它计算我使用 LU
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
与其自身的多对多关系不能利用相关名称属性

我正在尝试克隆 Twitter 该应用程序有一系列用户每个用户都有一个用户个人资料 UserProfile模型如下 class UserProfiles models Model authenticated user models One
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
Django：什么时候运行 makemigrations？

除了向模型添加删除修改字段之外当我向模型添加或修改方法时 Django 还会检测到更改所以我的问题是我应该跑步吗makemigrations每次我在模型中更改或添加新方法时当您添加更改模型方法时您不需要运行 manage ma
预期设备类型为 cuda 的对象，但在 Pytorch 中获得了设备类型 cpu

我有以下计算损失函数的代码 class MSE loss nn Module metric L1 L2 norms or cosine similarity mode training or evaluation mode def init
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p

随机推荐

opencv动态目标跟踪学习总结

用opencv实现对视频中动态目标的追踪第一步 xff0c 是要建立一个编程环境 xff0c 然后加载opencv的库路径等等具体步骤在 http www opencv org cn 的安装中有详细介绍第二步 xff0c 建立一
计算机视觉领域常用数据集汇总(持续更新)

入坑CV两年以来收藏的数据集网址或博文 xff0c 与大家分享 xff0c 欢迎评论区补充网址领域类型人脸数据集大全人脸识别检测转载DeepFahion衣服属性类型识别 xff0c 关键点检测官网coco物体检测官网IMDB WIKI
CVPR 2020论文开源项目合集

0 参考github地址 CVPR 2020论文开源项目合集 1 阅读随笔更新 2020 3 11 CVPR 2020 3D Pose Estimation阅读随笔1 xff1a Cross View Tracking for Multi
CVPR 2020：Cross-View Tracking for Multi-Human 3D Pose Estimation at over 100 FPS 论文阅读随笔

CVPR 2020论文阅读系列之 3D 姿态估计一 xff1a 论文 xff1a Cross View Tracking for Multi Human 3D Pose Estimation at over 100 FPS 欢迎批评指正以
Pycharm快捷键及使用技巧

一基本设置二调试三快捷键快捷键操作Ctrl 43 点击查看源码Ctrl 43 Q查看代码docCtrl 43 Shift 43 I查看代码源码Shift 43 Enter向下另起一行 xff0c 光标在行内任意位置都能另起一行
CVPR 2020: Back to the Future: Joint Aware Temporal Deep Learning 3D Human Pose Estimation 论文阅读随笔

论文网址 Github
CVPR 2020: VIBE: Video Inference for Human Body Pose and Shape Estimation 阅读随笔

论文地址 Github地址以下为我的OneNote阅读笔记 xff0c 为图片格式 xff0c 留言邮件可发原文件
CVPR2020: GhostNet: More Features from Cheap Operations 论文阅读随笔

参考地址 xff1a 论文地址 Github地址以下为我的阅读OneNote笔记为图片格式原文件可留言私信获取如有问题 xff0c 可留言讨论
CVPR2020 Oral: PolarMask: Single Shot Instance Segmentation with Polar Representation 论文阅读随笔

论文原文 Github代码作者本人的解读以下为我自己的阅读笔记 xff0c 为OneNote图片格式 xff0c 留言或私信可获取原文件 xff0c 欢迎讨论
Pytorch源码学习之一： torchvision.models.alexnet

Pytorch源码学习之一 torchvision models alexnet torch中一行代码导入的alexnet配置如下 xff1a 64 64 11x11 stride 61 4 43 ReLU 43 Maxpooling 3x
CVPR2020: Suppressing Uncertainties for Large-Scale Facial Expression Recognition 阅读随笔

0 Abstract 大规模表情识别 large scale Facial Expression Recognition FER 的主要挑战在于不确定性 uncertainties xff0c 这些不确定性来源于模棱两可的面部表情 ambi
CSS字体加粗总结

CSS 加粗知识与CSS 加粗实例 DIV 43 CSS基础知识 CSS 加粗这里指的是通过DIV CSS控制对象的加粗使用CSS属性单词 font weight 对象值 xff1a 从100到900 xff0c 最常用font weig
Python argparse用法详情

在神经网络训练中 xff0c argparse的方法可以让改变参数模型超参文件位置 GPU等更加方便一 argparse使用步骤 Step1 导入argparse模块 span class token keyword import
Python time获取各种格式的时间

一时间戳格式 span class token keyword import span time start span class token operator 61 span time span class token punctuat
CVPR2020: CenterMask:Real-Time Anchor-Free Instance Segmentation 阅读随笔
Pytorch源码学习之二：torchvision.models.vgg

0 VGG的网络结构一 torchvision源码这种通过配置文件一次性搭建相似网络的结构的方法十分值得学习和模仿这也是相对于AlexNet的实现过程不同之处我对其做了一丁点修改 xff0c 源码网址可见torchvision mo
ICCV 2019: FCOS: Fully Convolutional One-Stage Object Detection论文阅读笔记
Pytorch源码学习之三：torchvision.models.resnet

一网络结构 1 BasicBlock 2 BootleNeck和group convolution 3 Dilated Convolution with a 3 x 3 kernel and dilation rate 2 二 torch
python将多帧图片组合成视频

span class token keyword import span cv2 span class token keyword import span os span class token keyword import span ra
Pytorch源码学习之四：torchvision.models.squeezenet

0 介绍 Squeezenet网址 torchvision model squeeze官方文档主要思想 xff1a 堆叠Fire模块 xff0c 每个Fire模块 xff0c 分别采用1x1和3x3两个分支 xff0c 最后做拼 xff1