如何从 pytorch 模块获取子模块序列？

2024-01-27

对于火炬module https://pytorch.org/docs/master/generated/torch.nn.Module.html，我想我可以用.named_children, .named_modules等来获取子模块的列表。但是，我想该列表不是按顺序给出的，对吧？一个例子：

In [19]: import transformers

In [20]: model = transformers.DistilBertForSequenceClassification.from_pretrained('distilb
    ...: ert-base-cased')

In [21]: [name for name, _ in model.named_children()]
Out[21]: ['distilbert', 'pre_classifier', 'classifier', 'dropout']

的顺序.named_children()在上面的模型中，给出了 distilbert、pre_classifier、classifier 和 dropout。但是，如果您检查code https://github.com/huggingface/transformers/blob/9931f817b75ecb2c8bb08b6e9d4cbec4b0933935/src/transformers/modeling_distilbert.py#L641，显然dropout发生在之前classifier。那么如何获得这些子模块的顺序呢？

在 Pytorch 中，结果为print(model) or .named_children()等根据声明顺序列出__init__模型的类别，例如

Case 1

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 10, kernel_size=5)
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        self.fc1 = nn.Linear(320, 50)
        self.fc2 = nn.Linear(50, 10)
        self.conv2_drop = nn.Dropout2d()

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = x.view(-1, 320)
        x = F.relu(self.fc1(x))
        x = F.dropout(x, p=0.6)
        x = self.fc2(x)
        return F.log_softmax(x, dim=1)

model = Model()
print(model)
[name for name, _ in model.named_children()]
# output
['conv1', 'conv2', 'fc1', 'fc2', 'conv2_drop']

Case 2

更改了顺序fc1 and fc2构造函数中的层。

class Model(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(1, 10, kernel_size=5)
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        self.fc2 = nn.Linear(50, 10)
        self.fc1 = nn.Linear(320, 50)
        self.conv2_drop = nn.Dropout2d()

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        x = x.view(-1, 320)
        x = F.relu(self.fc1(x))
        x = F.dropout(x, p=0.6)
        x = self.fc2(x)
        return F.log_softmax(x, dim=1)

model = Model()
print(model)
[name for name, _ in model.named_children()]
# output
['conv1', 'conv2', 'fc2', 'fc1', 'conv2_drop']

这就是为什么classifier之前打印过dropout正如它在构造函数中声明的那样：

class DistilBertForSequenceClassification(DistilBertPreTrainedModel):
        ...
        self.distilbert = DistilBertModel(config)
        self.pre_classifier = nn.Linear(config.dim, config.dim)
        self.classifier = nn.Linear(config.dim, config.num_labels)
        self.dropout = nn.Dropout(config.seq_classif_dropout)

尽管如此，您可以使用模型的子模块.modules()等，但它们只会按照声明的顺序列出__init__。如果您只想打印基于的结构forward方法，您可以尝试使用pytorch 摘要 https://github.com/Fangyh09/pytorch-summary.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

huggingfacetransformers

如何从 pytorch 模块获取子模块序列？的相关文章

PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
BertTokenizer.from_pretrained 错误并显示“连接错误”

我正在尝试从 Huggingface 下载 BERT 的分词器我正在执行 tokenizer BertTokenizer from pretrained bert base uncased Error
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
删除 Torch 张量中的行

我有一个火炬张量如下 a tensor 0 2215 0 5859 0 4782 0 7411 0 3078 0 3854 0 3981 0 5200 0 1363 0 4060 0 2030 0 4940 0 1640 0 6025 0
训练新的 AutoTokenizer 拥抱脸部

收到此错误 AttributeError GPT2Tokenizer 对象没有属性 train new from iterator 与拥抱面部文档非常相似我更改了输入就是这样不应该影响它有一次就成功了 2小时后回来查看发现并没有
pytorch grad 在 .backward() 之后为 None

我刚刚安装火炬 1 0 0 on Python 3 7 2 macOS 并尝试tutorial https pytorch org tutorials beginner blitz autograd tutorial html sphx g
如何平衡 GAN 中生成器和判别器的性能？

这是我第一次使用 GAN 我面临着判别器多次优于生成器的问题我正在尝试重现PA模型来自本文 http openaccess thecvf com content ICCV 2017 papers Sajjadi EnhanceNet Si
在 PyTorch 中原生测量多类分类的 F1 分数

我正在尝试在 PyTorch 中本地实现宏 F1 分数 F measure 而不是使用已经广泛使用的sklearn metrics f1 score https scikit learn org stable modules generat
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
pytorch 中的 keras.layers.Masking 相当于什么？

我有时间序列序列我需要通过将零填充到矩阵中并在 keras 中使用 keras layers Masking 来将序列的长度固定为一个数字我可以忽略这些填充的零以进行进一步的计算我想知道它怎么可能在 Pytorch 中完成要么我需要
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
如何使用Python计算多类分割任务的dice系数？

我想知道如何计算多类分割的骰子系数这是计算二元分割任务的骰子系数的脚本如何循环每个类并计算每个类的骰子先感谢您 import numpy def dice coeff im1 im2 empty score 1 0 im1 numpy
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
pytorch 的 IDE 自动完成

我正在使用 Visual Studio 代码最近尝试了风筝这两者似乎都没有 pytorch 的自动完成功能这些工具可以吗如果没有有人可以推荐一个可以的编辑器吗谢谢你使用Pycharmhttps www jetbrains co
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee

随机推荐

通过 id 删除骨干模型？

可以通过id删除模型吗文档说您需要传入模型本身才能将其删除所以我需要先获取模型然后删除它我不能直接通过id删除它吗您的意思是从集合中删除模型吗查看文档似乎您确实需要传递一个真实的模型但源代码表明您可以只传递一个模型id或型号c
具有唯一键的javascript和es6过滤器数组

我有一个变量列表例如 var name list some list console log name list Array 3 0 Object name Johny 1 Object name Monty 2 Object3 name
统一加速

我正在尝试在 Unity 中模拟加速和减速我编写了代码来在 Unity 中生成轨道并根据时间将对象放置在轨道上的特定位置结果看起来有点像这样我目前遇到的问题是样条线的每个部分都有不同的长度并且立方体以不同但均匀的速度穿过每个部分
指定父级 div 的不透明度，但使其不影响子级 HTML 元素

我在 div 中有一个段落元素 div 的不透明度为 0 3 段落的不透明度为 1 当我显示元素时该段落看起来是透明的就像它的不透明度为 0 3 一样有没有办法让div内的段落完全不透明也许我可以为此设置一个 CSS 值 div s
跳过没有装饰器语法的单元测试

我有一套使用 TestLoader 的来自单元测试模块 loadTestsFromModule 方法加载的测试即 suite loader loadTestsFromModule module 这给了我一个非常充足的运行良好的测试列表
在Android模拟器中添加铃声

有谁知道如何向 Android 模拟器添加下载铃声或 mp3 声音 Go to DDMS in Eclipse 点击File Explorer选项卡并导航至mnt sdcard 单击创建新文件夹Plus图标称为ringtones 然后单击
哪里可以找到 Android 示例？

我检查了谷歌开发者网站上的一些 Android 开发练习和示例我发现了这个网页 http developer android com tools samples index html http developer android com
Haskell - 非法多态类型？

为什么该类型单独使用可以编译但放入列表却失败 ft1 Foldable t Num a gt t a gt a ft1 F foldl 0 fTest Foldable t Num a gt t a gt a fTest F foldl
Django Cripy-Forms 找不到 CSS

我正在使用 Django 和 Crispy Forms 我可以正确呈现表单但不会出现 CSS 格式我需要做什么我已经添加了 CRISPY TEMPLATE PACK bootstrap to my settings py file h
如何让 django 在继续完成与请求相关的任务之前给出 HTTP 响应？

在我的 django 活塞 API 中我想在调用另一个需要相当长的时间的函数之前向客户端产生返回一个 http 响应如何使yield 给出包含所需JSON 的HTTP 响应而不是与生成器对象创建相关的字符串我的活塞处理程序方法如下
如何读取属性文件并使用项目 Gradle 脚本中的值？

我正在开发一个 Gradle 脚本我需要阅读local properties文件并使用属性文件中的值build gradle 我正在按照以下方式进行操作我运行了下面的脚本它现在抛出一个错误但它也没有执行任何操作例如创建删除和复制
Django-CKEditor 不会渲染图像

我已经安装了 Django CKEditor 并对其进行了配置以用于开发目的现在我可以编辑文本并将其作为文本字段保存到数据库中但是在插入图像时我遇到了很大的问题我可以插入图像它似乎可以正确保存到本地主机正确的文件夹但是当将图像渲
如何更改 setInterval 和 setTimeout 函数中“this”的范围

怎么可能使用this代替setInterval and setTimeout calls 我想这样使用它 function myObj this func function args setTimeout function this fun
如何解决Require.js中的循环依赖？

基本上这个想法是子模块创建一个对象并且该对象应该是作为主模块的实用程序库的一部分然而子对象depends关于 main 的实用程序 Main module define sub function sub var utils
NameError：未初始化的常量 Bundler

我刚刚将我的网络服务器更改为 Puma 并且必须将我的开发数据库从 sqlite 更改为 postgresql 但现在每次我尝试运行 rake db migrate 时都会收到此错误 rake aborted NameError unini
为 ObjectContext 创建接口

我正在尝试创建一个抽象层ObjectContext 我理解 OC 是一个工作单元但我并不完全了解如何为它编写一个好的界面理想情况下我希望能够交换实现的 RealDataContext IDataContext对于像 FakeDataC
求解 a^3 + b^4 = c^3 + d^3 最佳运行时间

注意这个问题不同于写出 a 3 b 3 c 3 d 3 的所有解 https stackoverflow com questions 14454133 write all solutions for a3 b3 c3 d3因为我需要帮助理
SQL 如果 select 语句不返回任何行，则执行替代 select 语句

基本上什么语法可以让我实现标题声明 If select statement 1 returns 0 rows THEN select statement 2 else select statement 3 以便 sql 返回语句 2 或
将图库中的所有图像加载到 android 中的应用程序中

我正在创建一个应用程序其中我需要图库中的所有图像到我的应用程序中其中有一个 girdview 我希望所有文件夹中的所有图像都显示在网格视图中 String proj MediaStore Images Media DATA MediaS
如何从 pytorch 模块获取子模块序列？

对于火炬module https pytorch org docs master generated torch nn Module html 我想我可以用 named children named modules等来获取子模块的列表但是

如何从 pytorch 模块获取子模块序列？

如何从 pytorch 模块获取子模块序列？ 的相关文章

随机推荐

热门标签

如何从 pytorch 模块获取子模块序列？的相关文章