Pytorch源码学习之二：torchvision.models.vgg

2023-05-16

0. VGG的网络结构

VGG网络结构

一、torchvision源码

这种通过配置文件一次性搭建相似网络的结构的方法十分值得学习和模仿.这也是相对于AlexNet的实现过程不同之处.
我对其做了一丁点修改，源码网址可见torchvision.models.vgg源码网址

'''
VGG的torchvison实现重写,
'''
import torch
import torch.nn as nn
try:
    from torch.hub import load_state_dict_from_url
except ImportError:
    from torch.utils.model_zoo import load_url as load_state_dict_from_url

__all__ = [
    'VGG', 'vgg11', 'vgg11_bn', 'vgg13', 'vgg13_bn', 'vgg16', 'vgg16_bn',
    'vgg19_bn', 'vgg19',
]
model_urls = {
    'vgg11': 'https://download.pytorch.org/models/vgg11-bbd30ac9.pth',
    'vgg13': 'https://download.pytorch.org/models/vgg13-c768596a.pth',
    'vgg16': 'https://download.pytorch.org/models/vgg16-397923af.pth',
    'vgg19': 'https://download.pytorch.org/models/vgg19-dcbb9e9d.pth',
    'vgg11_bn': 'https://download.pytorch.org/models/vgg11_bn-6002323d.pth',
    'vgg13_bn': 'https://download.pytorch.org/models/vgg13_bn-abd245e5.pth',
    'vgg16_bn': 'https://download.pytorch.org/models/vgg16_bn-6c64b313.pth',
    'vgg19_bn': 'https://download.pytorch.org/models/vgg19_bn-c79401a0.pth',
}

class VGG(nn.Module):

    def __init__(self, features, num_classes=1000, init_weights=True):
        super(VGG, self).__init__()
        self.features = features
        self.init_weights= init_weights
        self.avgpool = nn.AdaptiveAvgPool2d((7,7))
        self.classifier = nn.Sequential(
            nn.Linear(512 * 7 * 7, 4096),
            nn.ReLU(inplace=True),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, num_classes),
        )
        if self.init_weights:
            self._initialize_weights()

        def forward(self, x):
            x = self.features(x)
            x = torch.avgpool(x)
            x = torch.flatten(x, start_dim=1)
            x = self.classifier(x)
            return x

        def _initialize_weights(self):
            for m in self.modules():
                if isinstance(m, nn.Conv2d):
                    nn.init.kaiming_normal_(m.weight, model='fan_out',
                                            nonlinearity='relu')
                    if m.bias is not None:
                        nn.init.constant_(m.bias, 0)
                    elif isinstance(m, nn.BatchNorm1d):
                        nn.init.constant_(m.weight, 1)
                        nn.init.constant_(m.bias, 0)
                    elif isinstance(m, nn.Linear):
                        nn.init.normal_(m.weight, 0, 0.01)
                        nn.init.constant_(m.bias, 0)

def make_layer(cfg, batch_norm=False):
    layers = []
    in_channels = 3
    for v in cfg:
        if v == 'M':
            layers += [nn.MaxPool2d(kernel_size=2, stride=2)]
        else:
            conv2d = nn.Conv2d(in_channels=in_channels, out_channels=v, kernel_size=3, stride=1, padding=1)
            if batch_norm:
                layers += [conv2d, nn.BatchNorm2d(v)]
            else:
                layers += [conv2d, nn.ReLU(inplace=True)]
        in_channels = v
    return nn.Sequential(*layers)
cfgs = {
    'A': [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'],
    'B': [64, 64, 'M', 128, 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'],
    'D': [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'M', 512, 512, 512, 'M', 512, 512, 512, 'M'],
    'E': [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 256, 'M', 512, 512, 512, 512, 'M', 512, 512, 512, 512, 'M'],
    }

def _vgg(arch, cfg, batch_norm, pretrained, progress, **kwargs):
    '''
    搭建vgg网络
    :param arch:网络名称，用来加载预训练模型
    :param cfg: 配置，用来搭建网络
    :param batch_norm: bool，是否采用BN
    :param pretrained: bool,是否采用Pretrained
    :param progress: bool,下载时是否显示进度条
    :param kwargs:其它参数
    :return:返回搭建的vgg网络
    '''
    if pretrained:
        kwargs['init_weights']  = False
    model = VGG(make_layer(cfg[cfg], batch_norm=batch_norm), **kwargs)
    if pretrained:
        state_dict = load_state_dict_from_url(model_urls[arch],
                                              progress=progress)
        model.load_state_dict(state_dict)
    return model

def vgg11(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg11', 'A', False, pretrained, progress, **kwargs)

def vgg11_bn(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg11_bn', 'A', True, pretrained, progress, **kwargs)

def vgg13(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg13', 'B', False, pretrained, progress, **kwargs)

def vgg13_bn(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg13_bn', 'B', True, pretrained, progress, **kwargs)

def vgg16(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg16', 'D', False, pretrained, progress, **kwargs)

def vgg16_bn(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg16_bn', 'D', True, pretrained, progress)

def vgg19(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg19', 'E', False, pretrained, progress, **kwargs)

def vgg19_bn(pretrained=False, progress=True, **kwargs):

    return _vgg('vgg19_bn', 'E', pretrained, progress, **kwargs)

二、一些值得学习的用法笔记

 #将start_dim至end_dim展成一维向量
torch.flatten(tenor, start_dim, end_dim)
x = torch.flatten(x, start_dim=1)
#效果同下
x = x.view(x.size(0), -1)

#使用何大佬在2015年提出的方法
torch.nn.init.kaiming_normal_(tensor, a=0, 
                          model='fan_in', nonlinearity='leaky_relu')
nn.init.kaiming_normal_(m.weight, model='fan_out',
                                            nonlinearity='relu')

#使用均值为mean,标准差为std的正态分布填充输入tensor
torch.nn.init.normal_(tensor, mean=0., std=1.)

#使用浮点数val填充tensor
nn.init.constant_(tensor, val)

#搭建网络的一种范式
layer = []
layer += [nn.Conv2d(...), nn.ReLU(inplace=True)]
layer += [nn.BatchNorm2d(...)]
nn.Sequential(*layers)

#从网络上加载参数
torch.hub.load_state_dict_from_url(url,  model_dir=None, map_location=None, progress=True)
#url-下载的目标网址
#model_dir - 保存参数的目录
#map_location - a function or a dict specifying how to remap storeage locations.
state_dict = load_state_dict_from_url(model_urls[arch],
                                              progress=progress)
#progress - 是否展示下载的进度条

#载入参数到模型
#torch.nn.modules.module.Module
#def load_state_dict(self, state_dict, strict=True)
model.load_state_dict(state_dict)

#*args 和 **kwargs都代表1个或多个参数的意思.*args传入tuple类型的无名参数，而**kwargs传入的参数是dict类型
def myprint(*args):
    print(*args)
myprint(10, 2) #10 2

def mykwprint(**kwargs):
    key = kwargs.keys()
    value = kwargs.values()
    print(key) #dict_keys(['epoch', 'LR'])
    print(value) #dict_values([10, 2])
mykwprint(epoch=10, LR=2)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch源码学习之二：torchvision.models.vgg 的相关文章

【大陆ARS408毫米波雷达】一种利用串口解析雷达数据的方法

硬件平台 xff1a ARS408毫米波雷达 can转485转换器 485转串口转换器软件平台 xff1a Windows10 python3 本篇博客实现的功能 xff1a 一通过两个转换器将毫米波雷达的原始数据传入电脑端的串口中二
ubuntu14.04系统下对SD卡分区

在ubuntu14 04系统下对SD卡进行分区分为3步 xff1a 注意 xff1a 进行SD卡分区时 xff0c 用户操作权限为root权限 xff01 1 umount SD卡查看SD卡挂载目录 xff0c 一般在 media目录下
docker安装图形化管理界面

首先看下这个界面的样子还是比较好看 xff0c 而且在同一个局域网中都可以登录进行管理说下安装教程吧首先下载这个镜像 xff1a sudo docker pull portainer portainer 然后创建这个容器 sudo d
JSP小脚本学习

小脚本可以将任何数量的小脚本包含在页面中 xff0c 小脚本是有效的JAVA语言语句 xff0c 变量或方法声明或表达式小脚本的语法 xff0c lt code fragment gt 入门示例 xff1b lt 64 page lan
34. 在排序数组中查找元素的第一个和最后一个位置（C语言）

笨办法 xff0c 先找第一个等于target的位置 xff0c 再找最后一个等于target的位置 Note The returned array must be malloced assume caller calls free int
详解如何将TensorFlow训练的模型移植到Android手机

前言本文中出现的TF皆为TensorFlow的简称先说两句题外话吧 xff0c TensorFlow 前两天热热闹闹的发布了正式版r1 0 xff0c 可感觉自己才刚刚上手 r0 12 xff0c 这个时代发展的太快 xff0c 脚步是
ROS实践手册（一）ROS安装教程

笔者根据古月居 ROS入门21讲学习整理 xff0c 并参考 ROS机器人开发实践一书虚拟机安装注该部分可参考古月居 ROS入门21讲第2讲下载并安装 VMware Workstation Pro下载 Ubuntu18 04
Shell系统学习之如何执行Shell程序

系列文章目录 Shell系统学习之什么是Shell Shell系统学习之创建一个Shell程序 Shell系统学习之向Shell脚本传递参数 Shell系统学习之如何执行Shell程序 Shell系统学习之Shell变量和引用 Shell系
target_link_libraries接口的使用

target link libraries需要放在add executable之后 xff0c 用于指明连接进来的库 xff0c 官方推荐使用这个接口 xff0c 而不推荐使用link libraries xff0c link librar
TTL和RS232之间的详细对比

背景之前就听过TTL xff0c 一直没搞懂其和RS232的区别最近 xff0c 打算去买个USB转RS232的芯片 xff0c 结果找到此产品 xff1a 六合一多功能USB转UART串口模块CP2102 usb TTL485 232
STL 解算法题目例子

STL解算法题目例子
双子天蝎，爱情是不老的传说

双子天蝎 xff0c 爱情是不老的传说自注此文章乃双子座所写定有主观上的个人倾向转帖者 xff1a 就是我啦 xff0c 一个双子座的帅哥 xff08 自封 xff09 关于双子和天蝎 xff0c 我是很想很完整的写一些 xff0c
ASP2.0-130道ASP.NET面试题

1 简述 private protected public internal 修饰符的访问权限答 private 私有成员在类的内部才可以访问 protected 保护成员 xff0c 该类内部和继承类中可以访问 public 公共成员
opencv 图像去噪学习总结

OpenCV图像处理篇之图像平滑图像平滑算法程序分析及结果图像平滑算法图像平滑与图像模糊是同一概念 xff0c 主要用于图像的去噪平滑要使用滤波器 xff0c 为不改变图像的相位信息 xff0c 一般使用线性滤波器 xff0c 其
Ubuntu18.04 装系统、cuda、cudnn，主要是Ubuntu的内核版本不能太高，亲测很成功

一装系统简单的我就不说了 xff0c 之说要点 1 选择为图形或无线硬件安装第三方软件 2 在安装类型中 xff0c 选择其他选项 3 分区 xff0c 我选择分区2 3个 EFI分区 xff0c 主空间 xff0c 空间起始位置 x
被透明元素遮挡的元素还可以被点击到吗?

遮挡关于是否被遮挡的判断 xff0c 可以从对层叠级别的判断而确定见 xff1a 说说标准 CSS核心可视化格式模型 visual formatting model 之十三 xff1a 分层的显示 Layered presentatio
闲谈两句windows,linux

今天无意在一个群里说了一句 34 我觉得ubuntu比vista还好用 34 马上引来一帮人的反击 xff0c 所用伎俩仍然没有新意 1偷换概念 xff0c 开始用winxp说事 2游戏 xff0c 网银 3windows的系统很稳定 xf
python类的基本操作

本节给出类的基本操作函数 xff0c 方法查阅备用 0 定义类 span class token keyword class span span class token class name student span span class
python的异常类型

1 内建的异常类异常类含义Exception所有异常的基类AttributeError特性引用或赋值失败引发IOError试图打开不存在文件包括其他情况时引发IndexError使用序列中不存在的索引时引发KeyError在使用映射时
TFLearn代码示例

span class token keyword import span tflearn span class token keyword from span tflearn span class token punctuation spa

随机推荐

爬虫爬取大学排名示例

span class token comment coding utf 8 span span class token triple quoted string string 34 34 34 Created on Wed Nov 7 19
TensorFlow2.0 搭建简单的ResNet和训练

1 resnet py span class token keyword import span os span class token keyword import span tensorflow span class token key
Tensorflow2.0 保存和加载模型的几种方法

零综述 save load weights save load entire model saved model 一 Save the weights 1 一次性保存所有参数 model span class token punctuat
深度学习/机器学习常用网址汇总(持续更新)

这里汇总了入坑深度学习两年以来常用的网址 xff0c 以便查找 xff0c 持续更新 xff0c 欢迎评论区交流补充一深度学习机器学习网址名称简介Tensorflow python文档Tensorflow的python API的定义
opencv动态目标跟踪学习总结

用opencv实现对视频中动态目标的追踪第一步 xff0c 是要建立一个编程环境 xff0c 然后加载opencv的库路径等等具体步骤在 http www opencv org cn 的安装中有详细介绍第二步 xff0c 建立一
计算机视觉领域常用数据集汇总(持续更新)

入坑CV两年以来收藏的数据集网址或博文 xff0c 与大家分享 xff0c 欢迎评论区补充网址领域类型人脸数据集大全人脸识别检测转载DeepFahion衣服属性类型识别 xff0c 关键点检测官网coco物体检测官网IMDB WIKI
CVPR 2020论文开源项目合集

0 参考github地址 CVPR 2020论文开源项目合集 1 阅读随笔更新 2020 3 11 CVPR 2020 3D Pose Estimation阅读随笔1 xff1a Cross View Tracking for Multi
CVPR 2020：Cross-View Tracking for Multi-Human 3D Pose Estimation at over 100 FPS 论文阅读随笔

CVPR 2020论文阅读系列之 3D 姿态估计一 xff1a 论文 xff1a Cross View Tracking for Multi Human 3D Pose Estimation at over 100 FPS 欢迎批评指正以
Pycharm快捷键及使用技巧

一基本设置二调试三快捷键快捷键操作Ctrl 43 点击查看源码Ctrl 43 Q查看代码docCtrl 43 Shift 43 I查看代码源码Shift 43 Enter向下另起一行 xff0c 光标在行内任意位置都能另起一行
CVPR 2020: Back to the Future: Joint Aware Temporal Deep Learning 3D Human Pose Estimation 论文阅读随笔

论文网址 Github
CVPR 2020: VIBE: Video Inference for Human Body Pose and Shape Estimation 阅读随笔

论文地址 Github地址以下为我的OneNote阅读笔记 xff0c 为图片格式 xff0c 留言邮件可发原文件
CVPR2020: GhostNet: More Features from Cheap Operations 论文阅读随笔

参考地址 xff1a 论文地址 Github地址以下为我的阅读OneNote笔记为图片格式原文件可留言私信获取如有问题 xff0c 可留言讨论
CVPR2020 Oral: PolarMask: Single Shot Instance Segmentation with Polar Representation 论文阅读随笔

论文原文 Github代码作者本人的解读以下为我自己的阅读笔记 xff0c 为OneNote图片格式 xff0c 留言或私信可获取原文件 xff0c 欢迎讨论
Pytorch源码学习之一： torchvision.models.alexnet

Pytorch源码学习之一 torchvision models alexnet torch中一行代码导入的alexnet配置如下 xff1a 64 64 11x11 stride 61 4 43 ReLU 43 Maxpooling 3x
CVPR2020: Suppressing Uncertainties for Large-Scale Facial Expression Recognition 阅读随笔

0 Abstract 大规模表情识别 large scale Facial Expression Recognition FER 的主要挑战在于不确定性 uncertainties xff0c 这些不确定性来源于模棱两可的面部表情 ambi
CSS字体加粗总结

CSS 加粗知识与CSS 加粗实例 DIV 43 CSS基础知识 CSS 加粗这里指的是通过DIV CSS控制对象的加粗使用CSS属性单词 font weight 对象值 xff1a 从100到900 xff0c 最常用font weig
Python argparse用法详情

在神经网络训练中 xff0c argparse的方法可以让改变参数模型超参文件位置 GPU等更加方便一 argparse使用步骤 Step1 导入argparse模块 span class token keyword import
Python time获取各种格式的时间

一时间戳格式 span class token keyword import span time start span class token operator 61 span time span class token punctuat
CVPR2020: CenterMask:Real-Time Anchor-Free Instance Segmentation 阅读随笔
Pytorch源码学习之二：torchvision.models.vgg

0 VGG的网络结构一 torchvision源码这种通过配置文件一次性搭建相似网络的结构的方法十分值得学习和模仿这也是相对于AlexNet的实现过程不同之处我对其做了一丁点修改 xff0c 源码网址可见torchvision mo

Pytorch源码学习之二：torchvision.models.vgg

0. VGG的网络结构

一、torchvision源码

二、一些值得学习的用法笔记

Pytorch源码学习之二：torchvision.models.vgg 的相关文章

随机推荐

热门标签