Pytorch —— nn.Module类(nn.sequential)

2023-10-27

对于前面的线性回归模型、 Logistic回归模型和神经网络，我们在构建的时候定义了需要的参数。这对于比较小的模型是可行的，但是对于大的模型，比如100 层的神经网络，这个时候再去手动定义参数就显得非常麻烦，所以 PyTorch 提供了两个模块来帮助我们构建模型，一个是Sequential，一个是 Module。

nn.Module

nn.Module类是所有网络结构层次的父类。

当你要实现一个自己的层的时候，必须要继承这个类。

但是注意BN等norm层不是继承的nn.Module, 它继承的_BatchNorm，但是_BatchNorm的底层还是继承的nn.Module

而当我们使用一些现有的层，比如说线性层、卷积层的时候，它其实也是继承自nn.Module，只不过这个类因为使用的非常广泛，所以pytorch官方已经写好了

当我们自己实现类的话，必须继承自nn.Module，并且在init中完成初始化的步骤和forward中完成计算图的前向构建的过程

every layer is nn.Module

pytorch实现了大部分的layer,这些layer都继承于nn.Module

nn.conv2d卷积层

AvgPool,Maxpool,AdaptiveAvgPool

TransposeConv逆卷积

nn.Linear全连接层

nn.BatchNorm1d(1d,2d,3d)

nn.dropout

nn.ReLU

nn.Sequential

使用这些层非常方便，我们只需要调用一些初始化函数，然后再调用.call方法来调用其forward函数就可以使用它的一些功能

nn.sequential()用作容器Container

Sequential 允许我们构建序列化的模块。就把Sequential当作list来看

nn.sequential(), 一个有序的容器，神经网络模块将按照在传入构造器的顺序依次被添加到计算图中执行

keras中也有类似的类，tensorflow中没有

nn.sequential()本身也是一个nn.Module类

Sequential 允许我们构建序列化的模块，也就是说用了Sequential的好处是我们可以通过数字访问第几层，可以通过parameters、weights等参数显示网络的参数和权重

使用和不使用nn.Sequential()的对比

不使用
class Net(nn.Module):
 
    def __init__(self):
        super(Net, self).__init__()
 
        # xw+b
        self.fc1 = nn.Linear(28*28, 256)
        self.fc2 = nn.Linear(256, 64)
        self.fc3 = nn.Linear(64, 10)
 
    def forward(self, x):
        # x: [b, 1, 28, 28]
        # h1 = relu(xw1+b1)
        x = F.relu(self.fc1(x))
        # h2 = relu(h1w2+b2)
        x = F.relu(self.fc2(x))
        # h3 = h2w3+b3
        x = self.fc3(x)
 
        return x
使用
class Net(nn.Module):
 
    def __init__(self):
        super(Net, self).__init__()
 
        self.fc = nn.Sequential(
        	nn.Linear(28*28, 256)
        	nn.Relu()
            nn.Linear(256, 64)
            nn.Relu()
            nn.Linear(64, 10)
        	)
 
    def forward(self, x):
        # x: [b, 1, 28, 28]
        # h1 = relu(xw1+b1)
        x = self.fc(x)

        return x
Sequential的三种写法
net1 = nn.Sequential()
net1.add_module('conv', nn.Conv2d(3, 3, 3))
net1.add_module('batchnorm', nn.BatchNorm2d(3))
net1.add_module('activation_layer', nn.ReLU())
net2 = nn.Sequential(
        nn.Conv2d(3, 3, 3),
        nn.BatchNorm2d(3),
        nn.ReLU()
        )
from collections import OrderedDict
net3= nn.Sequential(OrderedDict([
          ('conv1', nn.Conv2d(3, 3, 3)),
          ('bn1', nn.BatchNorm2d(3)),
          ('relu1', nn.ReLU())
        ]))

3、parameter管理

使用nn.Module的话，它就会对你神经网络的内部参数进行一个有效的管理

4、modules管理

直系子节点叫children

所有的节点加载一个叫modules

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

nnModule

Pytorch —— nn.Module类(nn.sequential) 的相关文章

在 Pytorch 中执行优化时如何对变量应用界限？

我正在尝试使用 Pytorch 进行非凸优化试图最大化我的目标因此在 SGD 中最小化我想限制因变量 x gt 0 并且 x 值的总和小于 1000 我认为我已经以斜坡惩罚的形式正确实施了惩罚但我正在努力解决 x 变量的边界问题在
MNIST、torchvision 中的输出和广播形状不匹配

在 Torchvision 中使用 MNIST 数据集时出现以下错误 RuntimeError output with shape 1 28 28 doesn t match the broadcast shape 3 28 28 这是我的
PyTorch：tensor.cuda（）和tensor.to（torch.device（“cuda：0”））之间有什么区别？

在 PyTorch 中以下两种将张量或模型发送到 GPU 的方法有什么区别 Setup X np array 1 3 2 3 2 3 5 6 1 2 3 4 X model X torch DoubleTensor X Method
推导 pytorch 网络的结构

对于我的用例我需要能够采用 pytorch 模块并解释模块中的层序列以便我可以以某种文件格式在层之间创建连接现在假设我有一个简单的模块如下所示 class mymodel nn Module def init self input
Win10 64位上CUDA 12的PyTorch安装

我需要在我的 PC 上安装 PyTorch 其 CUDA 版本 12 0 pytorch 2 的表 https i stack imgur com X13oS png in In 火炬网站 https pytorch org get sta
无法将 cuda:0 设备类型张量转换为 numpy。首先使用 Tensor.cpu() 将张量复制到主机内存

我试图展示 GAN 网络在某些指定时期的结果打印当前结果的功能之前是在 TF 中使用的我需要换成pytorch def show result G net z num epoch show False save False path r
pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
查找张量中沿轴的非零元素的数量

我想找到沿特定轴的张量中非零元素的数量有没有 PyTorch 函数可以做到这一点我尝试使用非零 http pytorch org docs master torch html highlight nonzero torch nonzer
如何在 google colab 中运行 matlab .m 文件

我目前正在尝试运行这个存储库https github com Fanziapril mvfnet https github com Fanziapril mvfnet这需要一个步骤 Run the Matlab ModelGeneratio
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
PyTorch 教程错误训练分类器

我刚刚开始 PyTorch 教程使用 PyTorch 进行深度学习 60 分钟闪电战我应该补充一点我之前没有编写过任何 python 但其他语言如 Java 现在我的代码看起来像 import torch import torchvi
为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
torch-1.1.0-cp37-cp37m-win_amd64.whl 在此平台上不受支持的滚轮

我在开发 RNN 时需要使用 pyTorch 每当我尝试安装它时我都会收到一条错误消息指出 torch 1 1 0 cp37 cp37m win amd32 whl 在此平台上不受支持 pip3安装https download pyto
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T

随机推荐

还在为数据清洗抓狂？这里有一个简单实用的清洗代码集

选自towardsdatascience 作者 Admond Lee 机器之心编译参与 Geek AI 张倩数据清洗是数据科学家逃不掉的一份苦差事为了让这项工作不那么痛苦本文作者分享了自己的数据清洗代码集现实世界中的数据通常质量不
听说你还不知道什么是 python？带你深入理解什么是 python

文章目录前言什么是python python的由来我们为什么要学习python 帮助python学习的网站前言各位朋友们大家好在之后的时间里我将陆续为大家分享我在python学习过程中学习到的知识点如果你也对python感
【随机过程】 17 -离散时间马氏链典型应用

离散时间马尔科夫链的典型应用文章目录离散时间马尔科夫链的典型应用 0 概述 1 Page Rank 1 1 背景 1 2 模型建立 1 3 模型求解 2 MCMC 2 1 概述 2 2 实现思路 2 3 具体实现 2 3 1 第一步细
Qt基础之五：使用invokeMethod异步调用函数

在主线程中如果执行比较耗时的任务但是又不想单独开子线程来处理不妨试试Qt中提供QMetaObject invokeMethod方法该方法支持函数的异步调用这样就会在界面显示后去执行而不会卡主主界面 QMetaObject invo
[linux-sd-webui]图生文，blip/deepbooru

GitHub pharmapsychotic clip interrogator Image to prompt with BLIP and CLIPImage to prompt with BLIP and CLIP Contribute
【hadoop学习之路】Spark-SQL 实验报告 RDD转DataFrame

1 Spark SQL 基本操作 1 1 需求将下列JSON格式数据复制到Linux系统中并保存命名为employee json id 1 name Ella age 36 id 2 name Bob age 29 id 3 name
Pandas处理日期数据

一 pandaas日期处理的作用将2018 01 01 1 1 2018等多种日期格式映射成统一的格式对象在该对象上提供强大的功能支持几个概念 1 pd to datetime pandas的一个函数能将字符串列表 series变
数据结构——个人学习笔记

系列目录数据结构第一章绪论数据结构第二章线性表文章目录系列目录 2 1线性表的定义和特点 2 2线性表的操作定义 2 3线性表的顺序表示和实现线性表的重要基本操作 1 初始化线性表参数用指针 2 插入新增 3 取值 4 查找
easy modbus tcp

public static void Main string args ModbusClient modbusClient new ModbusClient 190 201 100 100 502 Ip Address and Port o
Android组件化和插件化的概念，android快速开发框架

开发单个模块时可以共享资源和工具类可以针对单个模块测试开发调试时不需要对整个项目进行编译多人合作时可以只关注自己的业务模块把某一业务当成单一项目来开发可以灵活的对业务模块进行组装和拆分 4 组件化开发的主要思路就是将一个Modu
c++求行列式的值（全排列法）

用全排列的方式求行列式的值递归体现在全排列中上代码 f函数是求行列式的值 include
flink中通过jdbc查询结果集使用 flink table api 创建临时视图

1 maven依赖
[转]QNX_HMI_crank工程的系统移植

如果你认为本系列文章对你有所帮助请大家有钱的捧个钱场点击此处赞助赞助额0 1元起步多少随意声明本文只用于个人学习交流若不慎造成侵权请及时联系我立即予以改正锋影 email 174176320 qq com 开发软件 Cr
python如何输出多个星号_如何使用python输出连续星号？

小编依稀记得自己初学编程时候第一节课老师就给我们演示了输出连续星号内容那时候真感叹python的神奇重温一遍这个内容入门小伙伴们可以来看下啦有关语法用嵌套打印小星星需求在控制台连续输出五行每一行星号的数量依次递增使用
如何从配置文件中获取属性

在项目中添加了一个腾讯云的短信业务领导说要我把这个项目整合到原本的业务中去业务那么多怎么搞继续询问后得知是整合到原本的短信业务中原本用的短信业务是短信猫来发短信问需要前端加传的参数吗答不允许继续询问得知是要在配置文件
[转]Tangram框架应用开发的一般模式

框架其实就是一种开发模式用tangram框架开发应用程序意味着选择一种面向接口模块化的开发方式这和传统的Delphi应用程序开发方式有一定区别对于刚刚接触框架的童鞋可能不知道如何下手因此有必要把框架的一般开发方式说明一下不过框架
深入分析HBase Compaction机制

Compaction介绍 Compaction是buffer gt flush gt merge的Log Structured Merge Tree模型的关键操作主要起到如下几个作用 1 合并文件 2 清除删除过期多余版本的数据 3
二叉树算法

每日一句少年就是少年他们看春风不喜看夏蝉不烦看秋风不悲看冬雪不叹看满身富贵懒察觉看不公不允敢面对只因他们是少年目录用递归和非递归两种方式实现二叉树的先序中序后序遍历递归方法非递归方法如何完成二叉树的宽度优先遍历
报文摘要算法

1 报文摘要算法报文摘要算法是一种将任意长度报文转换成固定长度的报文摘要算法它具有以下六个特点能够作用于任意长度的报文产生有限位数的标识信息易于实现具有单向性具有抗碰撞性具有高灵敏性 1 1 MD5 1 1 1 添加填充位
Pytorch —— nn.Module类(nn.sequential)

对于前面的线性回归模型 Logistic回归模型和神经网络我们在构建的时候定义了需要的参数这对于比较小的模型是可行的但是对于大的模型比如100 层的神经网络这个时候再去手动定义参数就显得非常麻烦所以 PyTorch 提供了两个模

Pytorch —— nn.Module类(nn.sequential)

nn.Module

every layer is nn.Module

nn.sequential()用作容器Container

Sequential的三种写法

3、parameter管理

4、modules管理

Pytorch —— nn.Module类(nn.sequential) 的相关文章

随机推荐

热门标签