pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

2024-04-24

我有一层layer in an nn.Module并在一次中使用两次或多次forward步。这个的输出layer稍后输入到相同的layer。 pytorch可以吗autograd正确计算该层权重的梯度？

def forward(x):
    x = self.layer(x)
    x = self.layer(x)
    return x

完整示例：

import torch
import torch.nn as nn
import torch.nn.functional as F

class net(nn.Module):
    def __init__(self,in_dim,out_dim):
        super(net,self).__init__()
        self.layer = nn.Linear(in_dim,out_dim,bias=False)

    def forward(self,x):
        x = self.layer(x)
        x = self.layer(x)
        return x

input_x = torch.tensor([10.])
label = torch.tensor([5.])
n = net(1,1)
loss_fn = nn.MSELoss()

out = n(input_x)
loss = loss_fn(out,label)
n.zero_grad()
loss.backward()

for param in n.parameters():
    w = param.item()
    g = param.grad

print('Input = %.4f; label = %.4f'%(input_x,label))
print('Weight = %.4f; output = %.4f'%(w,out))
print('Gradient w.r.t. the weight is %.4f'%(g))
print('And it should be %.4f'%(4*(w**2*input_x-label)*w*input_x))

Output:

Input = 10.0000; label = 5.0000
Weight = 0.9472; output = 8.9717
Gradient w.r.t. the weight is 150.4767
And it should be 150.4766

在这个例子中，我定义了一个只有一个线性层的模块（in_dim=out_dim=1并且没有偏见）。w是该层的权重；input_x是输入值；label是期望值。由于损失选择为 MSE，因此损失的公式为

((w^2)*input_x-label)^2

手工计算，我们有

dw/dx = 2*((w^2)*input_x-label)*(2*w*input_x)

我上面的示例的输出表明autograd给出了与手工计算相同的结果，这让我有理由相信它可以在这种情况下工作。但在实际应用中，该层可能具有更高维度的输入和输出，后面有一个非线性激活函数，并且神经网络可以有多个层。

我想问的是：我可以信任吗autograd处理这种情况，但比我的例子中复杂得多？当一个层被迭代调用时它是如何工作的？

这会工作得很好。从 autograd 引擎的角度来看，这不是循环应用程序，因为生成的计算图会将重复计算展开为线性序列。为了说明这一点，对于单个层，您可能有：

x -----> layer --------+
           ^           |
           |  2 times  |
           +-----------+

从 autograd 的角度来看，这看起来像：

x ---> layer ---> layer ---> layer

Here layer是同一层在图表上复制 3 次。这意味着在计算层权重的梯度时，它们将从所有三个阶段进行累积。所以使用时backward:

x ---> layer ---> layer ---> layer ---> loss_func
                                            |
       lback <--- lback <--- lback <--------+
         |          |          |
         |          v          |
         +------> weights <----+
                   _grad

Here lback表示的局部导数layer使用上游梯度作为输入的正向变换。每一个都会添加到该层的weights_grad.

循环神经网络在其基础上使用这种层（单元）的重复应用。例如，请参阅本教程使用字符级 RNN 对名称进行分类 https://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？的相关文章

根据另一个数据框中的数据量删除一个数据框中的行

我有两个 pandas 数据框A and B B是 A 的子集我想删除 A 中的所有数字如果 B 中存在该数字 But 如果一个数字在 A 中出现两次在 B 中出现 1 次那么它只会从 A 中删除该数字的 1 次出现这是我的示例数
winpdb 不适用于 python 3.3

我无法让 rpdb2 与 python 3 3 一起运行但根据多个来源这应该是可能的 rpdb2 d myscript py A password should be set to secure debugger client serv
在Python子目录中创建文件？

在我的 Python 脚本中我需要在子目录中创建一个新文件而不更改目录并且需要从当前目录不断编辑该文件 My code os mkdir datetime dst for ip in open list txt with open ip
Django：如何从管理界面调用管理自定义命令执行？

参考从代码执行管理命令 https stackoverflow com questions 907506 how can i call a custom django manage py command directly from a t
在 Kivy 应用程序中获取文本输入值

Python Kivy 新手尝试构建一个测试应用程序其中包含输入框确定按钮和单击确定按钮时应更改文本的标签但我得到了 NameError 全局名称 txt1 未定义我究竟做错了什么 import Kivy import kivy i
Pythonic方式逐行读取文件？

以下两种方法中逐行读取文件的 Pythonic 方法是什么 with open file r as f for line in f print line or with open file r as f for line in f read
chrome_options.binary_location() TypeError: 'str' 对象不可调用

我希望每个人都好我是 python 新手我尝试运行这段代码但我不明白问题是什么以及如何解决这个问题我的代码是 from selenium import webdriver from time import sleep url raw
Python - 重写 print()

我正在使用 mod wsgi 想知道是否可以覆盖 print 命令因为它没用这样做是行不通的 print myPrintFunction 因为这是一个语法错误 Print 不是 Python 2 x 中的函数因此这不能直接实现但是
在 Spark-submit 上的 _find_and_load 中获取文件“”，第 991 行

我目前使用的是Python 3 7 9 spark spark 2 4 6 bin hadoop2 6 在这个项目 venv 中我的设置为 kafka python 2 0 2 pip 21 2 4 py4j 0 10 9 pyspark
对seaborn图中的分类x轴进行排序

我正在尝试使用 seaborn 散点图绘制数据框中前 30 的值如下所示同一图的可重现代码 import seaborn as sns df sns load dataset iris function to return top 30
Python 有哪些 SOAP 客户端库，它们的文档在哪里？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
在 matplotlib 中查看然后自动关闭图形？

我必须检查我的参数设置是否正确因此我需要绘制许多图为了绘制这些图我选择使用 matplotlib 每次检查后我需要单击左上角的关闭按钮这很微不足道那么有没有什么方法可以让剧情在3 5秒左右显示并且无需点击就自动关闭呢我知道关于
Pandas 无法读取使用 h5py 创建的 hdf5 文件

当我尝试读取使用 h5py 创建的 HDF5 格式文件时出现 pandas 错误我想知道我是否只是做错了什么 import h5py import numpy as np import pandas as pd h5 file h5py
是否可以将 SpaCy 安装到 Raspberry Pi 4 Raspbian Buster

我一整天都在安装 SpaCy sudo pip install U spacy Looking in indexes https pypi org simple https www piwheels org simple Collectin
如何用不同的颜色填充seaborn.distplot中的区域

是否可以用颜色填充两条阈值线 line1 和 line2 之外的区域并通过 distplot 绘制的 KDE 曲线限制 Y 轴代表我的应用程序的 3 sigmas import pylab as pl import seaborn as
如何在 Python Paramiko 中配置 ssh StrictHostKeyChecking=no 的等效项

我正在使用 Paramiko 通过 Python 脚本进行 sshing 我的ssh命令如下 ssh A o strictHostKeyChecking no
使用 PyODBC 选择表中的列名

我正在编写一个 Python 程序该程序使用 PyODBC 从 Microsoft Access mdb 文件中选择一些数据我需要发现几个不同表的列名在 SQL Server 中这可以通过使用类似的查询来完成 SELECT c na
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
mpld3图，注释问题

我正在使用 mpld3 在 Intranet 网站上显示图形我正在使用将图形保存到字典并使用 mpld3 js 在客户端渲染它的选项除非我想使用注释否则该图呈现良好这些显然是抵消的我不明白为什么因为即使我将偏移量设置为 0 0
设置restrict_xpaths设置后出现UnicodeEncodeError

我是 python 和 scrapy 的新手将restrict xpaths 设置设置为 table class lista 后我收到了以下回溯奇怪的是通过使用其他 xpath 规则爬虫可以正常工作 Traceback most

随机推荐

从矩阵中删除零行（优雅的方式）

我有一个包含一些零行的矩阵我想删除零行矩阵是Nx3 我所做的很简单我创造std vector其中每三个元素代表一行然后我将其转换为Eigen MatrixXd 有没有一种优雅的方法来删除零行 include
在 ncurses 中的指定位置添加相同符号的快捷方式是什么？

我想添加str in ncurse屏幕带坐标x 5 to 24 y 23 to 42 这是一个正方形但我想不出一个简单的方法来做到这一点我试过了 stdscr addstr range 23 42 range 5 24 但这行不通它
使用敏捷方法建造飞机？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案开发者可以从其他行业学到很多东西作为一个思维练习是否有可能使用敏捷技术建造一架客机暂时忘记成本对硬件机身机翼等和软件进行迭代和增量
DYMOLA：opc 服务器如何使用 MATLAB 使用 dsin.txt 或 mat 文件进行初始化

我在 DYMOLA 中创建了一个 OPC 服务器现在我在 DYMOSIM 中有这个可以单击并初始化使用 dsin txt 的 MAT 文件现在我在 MATLAB 中创建了一个 GUI 文件并获取变量的输入并创建了一个 mat 文件
无法构建轮子 - 错误：无效命令“bdist_wheel”

我已经尝试了这个非常相关的问题中的所有内容为什么我无法在 python 中创建轮子 https stackoverflow com questions 26664102 why can i not create a wheel in py
postgresql自连接

假设我有一张这样的桌子 id device cmd value id unique row ID device device identifier mac address cmd some arbitrary command value v
Rails：创建删除表级联迁移

如何在 Rails 3 2 迁移中强制执行 DROP TABLE CASCADE 是否有一个选项可以传递给 drop table table name 在 Rails 4 中您可以执行以下操作 drop table accounts fo
如何使用在单击按钮上创建的用户触发图表中的放大和缩小？

我正在构建一个角度应用程序其中我们需要创建用于放大和缩小图表的单击按钮我们可以使用可悬停模式栏上的按钮放大缩小图表但这对于我们的应用程序来说不是必需的我们希望使用通过单击按钮创建的用户来放大和缩小图表有没有办法使用单击按钮触发可悬
Electron如何拦截http响应体

有什么办法可以拦截BrowserWindow主进程中的http响应主体没有调试器是否无法使用WebRequest类和onCompleted method 我可以使用调试器做到这一点但由于某种原因我不能使用它 await w webCon
在 Eclipse (Spring Source) 中，Grails 始终以生产模式构建

当在 Grails 项目中使用 Eclipse 时战争的构建似乎陷入了生产模式如果您想部署到附加的 tcServer 您只需右键单击您的项目然后选择运行方式 gt 在服务器上运行如果您将 grails 项目设置为 dev 右键单击
气流：Dag 每隔几秒安排两次

我尝试每天仅运行一次 DAG00 15 00 午夜 15 分钟然而它被安排了两次间隔几秒钟 dag DAG my dag default args default args start date airflow utils dates
显式语义分析

我遇到了这个术语显式语义分析它使用维基百科作为参考找到文档中的相似性并将它们分类如果我错了请纠正我我遇到的链接是here http www cs technion ac il gabr resources code esa es
十进制铸造

我有一个这样的十进制数 62 000 0000000 我需要将该小数转换为 int 它的小数总是为零所以我不会失去任何精度我想要的是这样的 62 000 存储在 C 中的 int 变量中我尝试了很多方法但它总是给我一个错误字符串的
Python列表来存储类实例？

给定一个 python 类class Student 和一个清单names 然后我想创建几个实例Student 并将它们添加到列表中names names For storing the student instances class St
如何将html页面的动态内容转换为pdf

在 html 页面中一些标签是使用 jquery 动态创建的内容是使用 jquery 和 php 从 msql 数据库加载的我想将这个动态页面转换为pdf 我尝试过以下代码但它生成 html 页面静态部分的 pdf html cod
在 C++ 中正确地将 `void*` 转换为整数

我正在处理一些使用外部库的代码您可以在其中通过void value 不幸的是前一个处理此代码的人决定通过将整数转换为 void 指针来将整数传递给这些回调 void val 我现在正在努力清理这个混乱并且我正在尝试确定将整数转换为整数
估计命令如何查找 R 公式中的变量名称？

我想使用 R 来估计大量模型nls 函数作用于用户定义的函数由于许多变量在我的规范中是固定的我想要一种在我的函数中预先设置它们的方法但我没有正确理解 R 如何在公式中包含的函数中查找变量我看过 Hadley Wickham 的高级
我无法获取 servlet 页面中的 POST 值？

我无法在 servlet 页面中获取 POST 值我之前的问题与这个问题相关如何从servlet页面中的ajax请求获取数据 https stackoverflow com questions 6042177 how to get th
如何找到已安装的pandas版本

我在使用 Pandas 的某些功能时遇到问题如何查看我的安装版本是什么 Check pandas version In 76 import pandas as pd In 77 pd version Out 77 0 12 0 933 g
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self

pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？ 的相关文章

随机推荐

热门标签

pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？的相关文章