Pytorch：了解 nn.Module 类内部如何工作

2024-03-27

一般来说，一个nn.Module可以由子类继承，如下所示。

def init_weights(m):
    if type(m) == nn.Linear:
        torch.nn.init.xavier_uniform(m.weight)  # 

class LinearRegression(nn.Module):
    def __init__(self):
        super(LinearRegression, self).__init__()
        self.fc1 = nn.Linear(20, 1)
        self.apply(init_weights)

    def forward(self, x):
        x = self.fc1(x)
        return x

我的第一个问题是，为什么我可以简单地运行下面的代码，甚至我的__init__没有任何正论training_signals看起来像那样training_signals被传递给forward()方法。它是如何工作的？

model = LinearRegression()
training_signals = torch.rand(1000,20)
model(training_signals)

第二个问题是如何self.apply(init_weights)内部工作？是否在调用之前执行forward method?

Q1：为什么我可以简单地运行下面的代码，甚至我的__init__没有任何位置参数training_signals看起来像那样training_signals被传递给forward()方法。它是如何工作的？

首先，__init__当您运行此行时调用：

model = LinearRegression()

正如您所看到的，您没有传递任何参数，也不应该传递任何参数。您的签名__init__与基类之一相同（运行时调用super(LinearRegression, self).__init__()）。如你看到的here https://github.com/pytorch/pytorch/blob/be757957bace28100e571ec7914765020be4a069/torch/nn/modules/module.py#L69, nn.Module的 init 签名很简单def __init__(self)（就像你的一样）。

Second, model现在是一个对象。当您运行以下行时：

model(training_signals)

你实际上是在调用__call__方法和传递training_signals作为位置参数。如你看到的here https://github.com/pytorch/pytorch/blob/be757957bace28100e571ec7914765020be4a069/torch/nn/modules/module.py#L522-L550，除其他事项外，__call__方法调用forward method:

result = self.forward(*input, **kwargs)

传递所有参数（位置和命名）__call__ to the forward.

Q2：怎么办？self.apply(init_weights)内部工作？是在调用forward方法之前执行的吗？

PyTorch 是开源的，因此您只需转到源代码并检查它即可。如你看到的here https://github.com/pytorch/pytorch/blob/be757957bace28100e571ec7914765020be4a069/torch/nn/modules/module.py#L248-L288，实现非常简单：

def apply(self, fn):
    for module in self.children():
        module.apply(fn)
    fn(self)
    return self

引用该函数的文档：it“applies fn递归到每个子模块（由.children()）也self》。基于实现，你还可以了解到需求：

fn必须是可调用的；
fn仅接收一个输入作为Module object;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch：了解 nn.Module 类内部如何工作的相关文章

如何 json_normalize() df 中的特定字段并保留其他列？ [复制]

这个问题在这里已经有答案了这是我的简单示例我的实际数据集中的 json 字段非常嵌套因此我一次解压一层我需要在 json normalize 之后保留数据集上的某些列 https pandas pydata org docs ref
DataFrame 中的字符串，但 dtype 是对象

为什么 Pandas 告诉我我有对象尽管所选列中的每个项目都是一个字符串即使在显式转换之后也是如此这是我的数据框
对打开文件的脚本进行单元测试

我编写了一个脚本它打开一个文件读取内容并进行一些操作和计算并将它们存储在集合和字典中我该如何为这样的事情编写单元测试我的问题具体是我会测试文件是否打开文件很大这是unix字典文件我如何对计算进行单元测试我真的必须手动计算
如何用xlrd读取公式

我正在尝试做一个解析器它读取几个 Excel 文件我通常需要位于行底部的值您可以在其中找到所有上部元素的总和因此单元格值实际上是 sum 或 A5 0 5 可以说对于使用 Excel 打开此文件的用户来说它看起来像一个数字这
远程控制或脚本打开 Office 从 Python 编辑 Word 文档

我想最好在 Windows 上在特定文档上启动 Open Office 搜索固定字符串并将其替换为我的程序选择的另一个字符串我该如何从外部 Python 程序中做到这一点 OLE 什么原生 Python 脚本解决方案 The doc
使用 Python 中的 IAM 角色访问 AWS API Gateway

我有一个 AWS API 网关我想使用它来保护其安全IAM 角色 http docs aws amazon com apigateway latest developerguide permissions html 我正在寻找一个包来帮助
基于 True/False 值的 Python 优雅赋值

我想根据三个布尔值中的值设置一个变量最直接的方法是 if 语句后跟一系列 elif if a and b and c name first elif a and b and not c name second elif a and not
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
在 GAE/Python 中放置一次性代码和每次代码的最佳位置在哪里？

我是 Google App Engine 和 Python 的新手我无法理解有关在 Google App Engine 上运行的 Python 应用程序的一些基本问题如果我想要执行代码对于每个传入的请求我应该将其放在哪里我们正在捕
从 python 中的缩进文本文件创建树/深度嵌套字典

基本上我想迭代一个文件并将每行的内容放入一个深层嵌套的字典中其结构由每行开头的空格数量定义本质上目标是采取这样的事情 a b c d e 并将其变成这样的东西 a b c d e Or this apple colours red
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
在 Python 中，如何获取特定文件中定义的类列表？

如果一个文件myfile py包含 class A object Some implementation class B object Some implementation 我如何定义一个方法以便在给定的情况下myfile py 它返回
PermanentTaskFailure：“模块”对象没有属性“迁移”

我在 google appengine 上使用 Nick Johnson 的批量更新库 http blog notdot net 2010 03 Announcing a robust datastore bulk update utili
使用 pandas 绘制带有误差线的条形图

我正在尝试从 DataFrame 生成条形图如下所示 Pre Post Measure1 0 4 1 9 这些值是我从其他地方计算出来的中值我还有它们的方差和标准差以及标准误差我想将结果绘制为具有适当误差线的条形图但指定多个误差值
Python：如何从文件中的一行读取字符并将它们转换为浮点数和字符串，具体取决于它们是数字还是字母？

我有一个如下所示的文件 1 1 C C 1 9873 2 347 3 88776 1 2 C Si 4 887 9 009 1 21 我想逐行读取文件的内容当我使用的行上只有数字时 for line in readlines file d
dask allocate() 或 apply() 中的变量列名

我有适用于pandas 但我在将其转换为使用时遇到问题dask 有一个部分解决方案here https stackoverflow com questions 32363114 how do i change rows and column
python csv按列转换为字典

是否可以将 csv 文件中的数据读取到字典中使得列的第一行是键同一列的其余行构成列表的值例如我有一个 csv 文件 strings numbers colors string1 1 blue string2 2 red string
Python列表对象属性“append”是只读的

正如标题所说在Python中我试图做到这一点以便当有人输入一个选择在本例中为Choice13 时它会从密码列表中删除旧密码并添加新密码 passwords mrjoebblock mrjoefblock mrjoegblock m
scrapy python 请求未定义

我在这里找到了答案 code for site in sites Link site xpath a href extract CompleteLink urlparse urljoin response url Link yield Re
如何将 Pandas Dataframe 中的字符串转换为字符列表或数组？

我有一个名为的数据框data 其中一列包含字符串我想从字符串中提取字符因为我的目标是对它们进行一次性编码并使之可用于分类包含字符串的列存储在预测因子如下 predictors pd DataFrame data columns Seq

随机推荐

Mono mkbundle 工具无法创建二进制文件，并抱怨输出文件不可用

根据来自的建议这个线程 https stackoverflow com questions 551554 can you compile c without using the net framework在运行没有 NET 的 C 应用程序
postgresql 存储过程开始提交结束

实际上在执行 postgresql 存储过程时我很困惑我从某处学到了以下内容 create or replace procedure update dba trades language plpgsql as begin CODE BL
完成部分网格并使其不漏水

我正在从 RealSense 相机捕获点云并使用 Trimesh 库将它们转换为网格问题是我只能从中得到一个不防水的网格如何完成网格并使其防水 I tried trimesh repair broken faces mesh co
jquery切换 - 在切换功能之间切换？

大家好我喜欢 jquery 的切换功能然而目前我面临一个小问题我不知道如何以最好的方式解决它我有一个名为 searchbox 的 div 它取决于用户设置是隐藏还是可见如果我单击按钮则触发的切换功能应该是 slideDown s
创建Python包并导入模块

我正在尝试编写我的第一个 Python 包几乎所有模块都需要使用 NumPy 我应该写吗import numpy在每个模块中或者包中是否有某个地方我可以将其导入一次以便每个模块都可以使用它最好的方法是什么是的只需将其导入到需要的地
在 iTunes Connect 中提交应用程序时附加屏幕截图的顺序

我目前正在提交我的应用程序以供审核并且我已经上传了主屏幕截图但不确定如何让我的其他屏幕截图以正确的顺序显示您必须在上传之前将它们全部选择并且没有任何指示它们的顺序有人可以告诉我您是否需要按正确顺序或相反顺序选择屏幕截图吗以相反的
Cloud Dataflow 中的作业失败：启用 Dataflow API

我目前正在尝试将 Dataflow 与 Pub Sub 结合使用但收到此错误工作流程失败原因 6e74e8516c0638ca 刷新您的凭据时出现问题请检查 1 为您的项目启用Dataflow API 2 您的项目有一个机器人服务帐
在 Visual Studio 2010 项目中包含外部库

我是视觉工作室的新手似乎无法在任何地方找到这个问题的答案我正在使用 VS2010 进行 VC 项目我有另一个项目构建到 lib 文件中并设置为参考但无法弄清楚如何实际包含标头事实证明谷歌毫无用处请帮忙通常这是通过将包含文件所
qt/c++ 动态命名变量

我正在为我的一项大学作业在 Qt 中开发一个 html 编辑器并且我在某些变量的命名方面遇到了问题问题是这样的当用户决定加载他们的项目时程序会迭代该文件夹并查找其中有多少个 html 文件然后它会创建要显示的选项卡我有一个自
Symfony2 Assetic 路由和资源错误

我有一个模板例如index html php 我在其中使用 php assetic 加载器如下所示如果我对模板文件进行任何更改我会得到路线 assetic 2b431f4 不存在如果我改变 assetic use controll
C 中逐个字符读取文件

我正在用 C 语言编写 BF 解释器但在读取文件时遇到了问题我以前用过scanf为了读取第一个字符串但是你的 BF 代码中不能有空格或注释现在这就是我所拥有的 char readFile char fileName FILE fil
EditText 随选择缩放

我有一个EditText我想缩放它并滚动setScaleX setScaleY它工作正常文本正在正确的位置进行编辑但是当我尝试选择文本时它会将选择手柄绘制到位置就像文本未缩放时一样我们都知道bug https code googl
对公司名称的 DataFrame 进行非规范化 [第 1 部分]

我有一个公司名称的 Pandas DataFrame 其结构如下 import numpy as np import pandas as pd df pd DataFrame name Nitron Pulset Rotaxi postal
我如何知道创建项目时使用的是哪个版本的 Delphi

如果我有 Delphi 项目的完整源代码我如何知道使用哪个版本即 Delphi 5 Delphi 7 Delphi 2010 等来创建它而无需在 Delphi 中打开它我有许多可以追溯到 Delphi 6 时代的项目我想对它们进
OpenId Connect 与 wso2 仅返回子声明

当我询问用户 WSO2 的信息时响应仅包含他的子信息 Request GET https srv wso2 domain com 9443 oauth2 userinfo schema openid Request headers Acc
AngularJS - 涉及异步数据的依赖注入

我想让当前登录的用户 ID 和用户名可供我的 Angular 指令使用我创建了一个 API 端点来检索此信息以及一些其他信息问题是 API 调用是异步的 var url baseUrl api sessions http get ur
没有指定 dataType 的自定义 ajaxTransport 函数不会触发（根本！）

我一直在尝试设置jQuery 的自定义 ajaxTransports http api jquery com extending ajax Transports在我们的产品的某些场景下缩短某些工作流程然而我在让这些运输受到尊重方面取得了
将 CSV 文件转换为 Java - 向后复制

我之前问过一个关于在java中将CSV文件转换为二维数组的问题我完全重写了我的代码几乎要重新编写了我现在遇到的唯一问题是它正在向后打印换句话说列打印在行应该打印的位置反之亦然这是我的代码 int board new int 2
D 中是否有相当于 C++ 的 Future/Promise ？

D 世界中是否存在 C 世界中的未来承诺等价物当然有标准并行度 http dlang org phobos std parallelism html但它并不完全具有承诺未来组合的功能没有相当于获取未来或设置结果或异常的功能您也不能
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe

Pytorch：了解 nn.Module 类内部如何工作

Pytorch：了解 nn.Module 类内部如何工作 的相关文章

随机推荐

热门标签

Pytorch：了解 nn.Module 类内部如何工作的相关文章