Pytorch源码学习之一： torchvision.models.alexnet

2023-05-16

Pytorch源码学习之一 torchvision.models.alexnet

torch中一行代码导入的alexnet配置如下：

64@11x11 stride=4 + ReLU + Maxpooling 3x3 stride=2
192@5x5 stride=1 + ReLU + MaxPooling 3x3 stride=2
384@3x3 stride=1 + ReLU
256@3x3 stride=1 + ReLU
256@3x3 stride=1 + ReLU + MaxPooling 3x3 stride=2
AvgPool => 6x6x256
Dropout
fc 6x6x256 => 4096 + ReLU + Dropout
fc 4096 => 4096 + ReLU
fc 4096 => num_classes

一、源码

参考地址torchvison.models.alexnet源码

#导入必要的pytorch包
import torch
import torch.nn as nn
class alexnet(nn.Module):
    
    def __init__(self, num_classes=1000):
        super(alexnet, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(64, 192, kernel_size=5, stride=1, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(192, 384, kernel_size=3, stride=1, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 256, kernel_size=3, stride=1, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1),
            nn.ReLU(inplace=True)  ,  
            nn.MaxPool2d(kernel_size=3, stride=2)
        )
        self.avgpool = nn.AdaptiveAvgPool2d((6,6))
        self.classifier = nn.Sequential(
            nn.Dropout(),
            nn.Linear(6*6*256, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Linear(4096, num_classes)
        )
    
    def forward(self, x):
        x = self.features(x)
        x = self.avgpool(x)
        x = x.view(x.size(0), -1)
        out = self.classifier(x)
        return out

一些函数/类用法笔记

下面对复现过程中遇到的函数的用法进行回顾，有些用法虽然已经熟知，仍做简介

torch.nn.Module
#所有神经网络的基类，自己写的代码应该继承该类
#继承主要是两个函数
#一个是 __init__(self, ) 用来堆叠网络结构
#一个是forward 用来写前向传播，并返回输出值

super(alexnet, self).__init__()
#super()函数是用来调用父类(超类)的一个方法
#用来解决多重继承问题，直接用类名调用父类方法在使用单继承上没问题，但是如果使用多继承，会涉及查找顺序(MRO)、重复调用等问题.
#主要语法为
super(type[, object-or-type])
#type -- 类
#object-or-type --类, 一般是self
#该行代码含义即为：调用父类nn.Module的.__init__方法

nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=0, groups=1, bias=True)
#padding各个维度0填充的个数，默认是0；
#后三个参数暂时还没用到，待补充

nn.MaxPool2d(kernel_size, stride=1)

nn.ReLU(inplace=False)
#inplace即为是否覆盖原数据，若选择True,则节省空间

nn.Dropout(p=0.5, inplace=False)
#训练时引入dropout, p为将参数归0的比例，默认保留0.5

nn.linear(in_features, out_features, bias=True)
# 输入通道数， 输出通道数， 是否有bias项

torch.Tensor.view(*shape)
#返回同样数据，不同shape的Tensor，返回的Tenosr必须跟原来的Tensor有相同的元素数
x = x.view(x.size(0), -1)
#即将卷积网络输出reshape为(batch_size, fc_shape),即相当于flatten的工作

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

torchvision

models

AlexNet

源码学习之一

Pytorch源码学习之一： torchvision.models.alexnet 的相关文章

Pytorch 分析器显示两个不同网络的卷积平均执行时间不同

我有两个网络我正在对它们进行分析以查看哪些操作占用了大部分时间我注意到CUDA time avg为了aten conv2d不同网络的操作有所不同这也增加了一个数量级在我的第一个网络中它是22us 而对于第二个网络则是3ms 我的第
“模块”对象没有属性“form_for_model”

当我使用属性时模型的表单我收到错误模块对象没有属性 form for model 我由此创建了该项目http www mikecantelon com q node 22 http www mikecantelon com q node
使用 pytorch 获取可用 GPU 内存总量

我正在使用 google colab 免费 Gpu 进行实验并想知道有多少 GPU 内存可供使用 torch cuda memory allocated 返回当前占用的 GPU 内存但我们如何使用 PyTorch 确定总可用内存 PyT
我可以使用逻辑索引或索引列表对张量进行切片吗？

我正在尝试使用列上的逻辑索引对 PyTorch 张量进行切片我想要与索引向量中的 1 值相对应的列切片和逻辑索引都是可能的但是它们可以一起吗如果是这样怎么办我的尝试不断抛出无用的错误类型错误使用 ByteTensor 类型的
如何在 google colab 中运行 matlab .m 文件

我目前正在尝试运行这个存储库https github com Fanziapril mvfnet https github com Fanziapril mvfnet这需要一个步骤 Run the Matlab ModelGeneratio
如何在会话中运行多个图 - Tensorflow API

张量流API https github com tensorflow models tree master research object detection提供了一些预先训练的模型并允许我们使用任何数据集来训练它们我想知道如何在一个张
pytorch grad 在 .backward() 之后为 None

我刚刚安装火炬 1 0 0 on Python 3 7 2 macOS 并尝试tutorial https pytorch org tutorials beginner blitz autograd tutorial html sphx g
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
django 查询所有相关集的过滤？

class Customer models Model name models CharField max length 200 class CustomerTicket models Model customer models OneTo
使 CUDA 内存不足

我正在尝试训练网络但我明白了我将批量大小设置为 300 并收到此错误但即使我将其减少到 100 我仍然收到此错误更令人沮丧的是在 1200 个图像上运行 10 epoch 大约需要 40 分钟有什么建议吗错了我怎样才能加快这
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
与其自身的多对多关系不能利用相关名称属性

我正在尝试克隆 Twitter 该应用程序有一系列用户每个用户都有一个用户个人资料 UserProfile模型如下 class UserProfiles models Model authenticated user models One
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
在模型中的方法中捕获异常时重定向

我正在使用 Authlogic connect 连接各种服务提供商 user rb中有一个方法 def complete oauth transaction token token class new oauth token and sec
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T

随机推荐

Ubuntu18.04 装系统、cuda、cudnn，主要是Ubuntu的内核版本不能太高，亲测很成功

一装系统简单的我就不说了 xff0c 之说要点 1 选择为图形或无线硬件安装第三方软件 2 在安装类型中 xff0c 选择其他选项 3 分区 xff0c 我选择分区2 3个 EFI分区 xff0c 主空间 xff0c 空间起始位置 x
被透明元素遮挡的元素还可以被点击到吗?

遮挡关于是否被遮挡的判断 xff0c 可以从对层叠级别的判断而确定见 xff1a 说说标准 CSS核心可视化格式模型 visual formatting model 之十三 xff1a 分层的显示 Layered presentatio
闲谈两句windows,linux

今天无意在一个群里说了一句 34 我觉得ubuntu比vista还好用 34 马上引来一帮人的反击 xff0c 所用伎俩仍然没有新意 1偷换概念 xff0c 开始用winxp说事 2游戏 xff0c 网银 3windows的系统很稳定 xf
python类的基本操作

本节给出类的基本操作函数 xff0c 方法查阅备用 0 定义类 span class token keyword class span span class token class name student span span class
python的异常类型

1 内建的异常类异常类含义Exception所有异常的基类AttributeError特性引用或赋值失败引发IOError试图打开不存在文件包括其他情况时引发IndexError使用序列中不存在的索引时引发KeyError在使用映射时
TFLearn代码示例

span class token keyword import span tflearn span class token keyword from span tflearn span class token punctuation spa
爬虫爬取大学排名示例

span class token comment coding utf 8 span span class token triple quoted string string 34 34 34 Created on Wed Nov 7 19
TensorFlow2.0 搭建简单的ResNet和训练

1 resnet py span class token keyword import span os span class token keyword import span tensorflow span class token key
Tensorflow2.0 保存和加载模型的几种方法

零综述 save load weights save load entire model saved model 一 Save the weights 1 一次性保存所有参数 model span class token punctuat
深度学习/机器学习常用网址汇总(持续更新)

这里汇总了入坑深度学习两年以来常用的网址 xff0c 以便查找 xff0c 持续更新 xff0c 欢迎评论区交流补充一深度学习机器学习网址名称简介Tensorflow python文档Tensorflow的python API的定义
opencv动态目标跟踪学习总结

用opencv实现对视频中动态目标的追踪第一步 xff0c 是要建立一个编程环境 xff0c 然后加载opencv的库路径等等具体步骤在 http www opencv org cn 的安装中有详细介绍第二步 xff0c 建立一
计算机视觉领域常用数据集汇总(持续更新)

入坑CV两年以来收藏的数据集网址或博文 xff0c 与大家分享 xff0c 欢迎评论区补充网址领域类型人脸数据集大全人脸识别检测转载DeepFahion衣服属性类型识别 xff0c 关键点检测官网coco物体检测官网IMDB WIKI
CVPR 2020论文开源项目合集

0 参考github地址 CVPR 2020论文开源项目合集 1 阅读随笔更新 2020 3 11 CVPR 2020 3D Pose Estimation阅读随笔1 xff1a Cross View Tracking for Multi
CVPR 2020：Cross-View Tracking for Multi-Human 3D Pose Estimation at over 100 FPS 论文阅读随笔

CVPR 2020论文阅读系列之 3D 姿态估计一 xff1a 论文 xff1a Cross View Tracking for Multi Human 3D Pose Estimation at over 100 FPS 欢迎批评指正以
Pycharm快捷键及使用技巧

一基本设置二调试三快捷键快捷键操作Ctrl 43 点击查看源码Ctrl 43 Q查看代码docCtrl 43 Shift 43 I查看代码源码Shift 43 Enter向下另起一行 xff0c 光标在行内任意位置都能另起一行
CVPR 2020: Back to the Future: Joint Aware Temporal Deep Learning 3D Human Pose Estimation 论文阅读随笔

论文网址 Github
CVPR 2020: VIBE: Video Inference for Human Body Pose and Shape Estimation 阅读随笔

论文地址 Github地址以下为我的OneNote阅读笔记 xff0c 为图片格式 xff0c 留言邮件可发原文件
CVPR2020: GhostNet: More Features from Cheap Operations 论文阅读随笔

参考地址 xff1a 论文地址 Github地址以下为我的阅读OneNote笔记为图片格式原文件可留言私信获取如有问题 xff0c 可留言讨论
CVPR2020 Oral: PolarMask: Single Shot Instance Segmentation with Polar Representation 论文阅读随笔

论文原文 Github代码作者本人的解读以下为我自己的阅读笔记 xff0c 为OneNote图片格式 xff0c 留言或私信可获取原文件 xff0c 欢迎讨论
Pytorch源码学习之一： torchvision.models.alexnet

Pytorch源码学习之一 torchvision models alexnet torch中一行代码导入的alexnet配置如下 xff1a 64 64 11x11 stride 61 4 43 ReLU 43 Maxpooling 3x

Pytorch源码学习之一： torchvision.models.alexnet

Pytorch源码学习之一 torchvision.models.alexnet

一、源码

一些函数/类用法笔记

Pytorch源码学习之一： torchvision.models.alexnet 的相关文章

随机推荐

热门标签