Pytorch 损失为 nan

2024-05-03

我正在尝试用 pytorch 编写我的第一个神经网络。不幸的是，当我想要得到损失时遇到了问题。出现以下错误信息：

RuntimeError: Function 'LogSoftmaxBackward0' returned nan values in its 0th output.

于是我尝试调试，发现了一些奇怪的东西。输入没有 nan 和 infs，我通过以下内容进行验证：

print(torch.any(torch.isnan(inputs)))

但如果我总是让模型 x 中的各个步骤输出，我发现在某个时刻将会出现 inf。

training

inputs, labels = data
print(torch.any(torch.isnan(inputs)))
optimizer.zero_grad()
outputs = model(inputs)
print(outputs)
loss = criterion(outputs, labels)
print(f"epoch: {epoch + 1} loss: {loss.item()}")
loss.backward()

optimizer.step()

model

class Net(Module):
    def __init__(self):
        super(Net, self).__init__()
        self.layer1 = Conv1d(in_channels=1, out_channels=5, kernel_size=5, stride=2, dtype=torch.float64)
        self.act1 = ReLU()
        self.pool1 = MaxPool1d(2)
        self.layer2 = Conv1d(in_channels=5, out_channels=1, kernel_size=2, dtype=torch.float64)
        self.fcl1 = Linear(1350, 16, dtype=torch.float64)

    def forward(self, x):
        print("raw", x)
        x = self.layer1(x)
        print("conv1d 1", x)
        x = self.act1(x)
        print("relu", x)
        x = self.layer2(x)
        print("conv1d 2", x)
        x = self.pool1(x)
        x = self.pool1(x)
        x = self.pool1(x)
        x = self.pool1(x)
        x = self.pool1(x)
        x = self.pool1(x)
        x = self.pool1(x)
        print("pools", x)
        x = self.fcl1(x)
        print("linear", x)
        return x

output

tensor(False)
raw tensor([[9.0616e+227, 2.4353e-152,  1.0294e-71,  ...,  0.0000e+00,
          0.0000e+00,  0.0000e+00]], dtype=torch.float64)
conv1d 1 tensor([[   -inf,    -inf,    -inf,  ..., -0.2516, -0.2516, -0.2516],
        [    inf,     inf,     inf,  ...,  0.3377,  0.3377,  0.3377],
        [   -inf,    -inf,    -inf,  ...,  0.4285,  0.4285,  0.4285],
        [   -inf,    -inf,    -inf,  ..., -0.1230, -0.1230, -0.1230],
        [    inf,     inf,     inf,  ...,  0.3793,  0.3793,  0.3793]],
       dtype=torch.float64, grad_fn=<SqueezeBackward1>)
relu tensor([[0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
        [   inf,    inf,    inf,  ..., 0.3377, 0.3377, 0.3377],
        [0.0000, 0.0000, 0.0000,  ..., 0.4285, 0.4285, 0.4285],
        [0.0000, 0.0000, 0.0000,  ..., 0.0000, 0.0000, 0.0000],
        [   inf,    inf,    inf,  ..., 0.3793, 0.3793, 0.3793]],
       dtype=torch.float64, grad_fn=<ReluBackward0>)
conv1d 2 tensor([[        -inf,         -inf,         -inf,  ..., -5.4167e+265,
         -5.4167e+265, -5.4167e+265]], dtype=torch.float64,
       grad_fn=<SqueezeBackward1>)
pools tensor([[        -inf, -5.4167e+265, -5.4167e+265,  ..., -5.4167e+265,
         -5.4167e+265, -5.4167e+265]], dtype=torch.float64,
       grad_fn=<SqueezeBackward1>)
linear tensor([[inf, inf, -inf, -inf, -inf, inf, inf, inf, inf, inf, inf, -inf, inf, inf, -inf, -inf]],
       dtype=torch.float64, grad_fn=<AddmmBackward0>)
tensor([[inf, inf, -inf, -inf, -inf, inf, inf, inf, inf, inf, inf, -inf, inf, inf, -inf, -inf]],
       dtype=torch.float64, grad_fn=<AddmmBackward0>)
epoch: 1 loss: nan

感谢您的帮助

抱歉，我的声誉不足以直接发表评论。这可能是由于学习率过高导致梯度爆炸造成的。建议降低学习率或者使用weight_decay。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

Pytorch 损失为 nan 的相关文章

如何在序列化器创建方法中获取 URL Id？

我有以下网址 url r member P
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
您可以将操作直接应用于map/reduce/filter 中的参数吗？

map and filter通常可以与列表理解互换但是reduce并不那么容易被交换map and filter 此外在某些情况下我仍然更喜欢函数语法但是当您需要对参数本身进行操作时我发现自己正在经历语法体操最终必须编写整个函数
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

app_offline.htm 文件不起作用

我已经为此奋斗了很多年但我就是无法让它发挥作用我去过的每个博客网站都说您无需在 IIS 中执行任何操作但这并不正确因为有多个网站配置例如应用程序虚拟目录简单的 php asp 网站虚拟网站有人可以向我解释一下 IIS7
是否可以从 Visual Studio Online (VS Team Services) 编辑我的代码？

I have 视觉工作室在线 http www visualstudio com products visual studio online overview vs 现在是 VS Team Services 帐户作为我的 MSDN 订阅的一
如何在 Perl 中访问名称包含在变量中的常量？

我有一组用 Perl 声明的常量 use constant C1 gt 111 use constant C2 gt 222 use constant C9 gt 999 my which constant C2 我如何构造一个 Perl
WiX - 根据环境将编译后的 web.config 复制到网站根目录

作为 WiX 安装的一部分我将所有转换编译的 web config 文件复制到安装目录编译后的 web config 的名称格式为 web ENV config 在我的安装 UI 中我创建了一个自定义对话框在其中解析 ENV 并填
Bash 变量：区分大小写？

Bash shell 脚本区分大小写吗是可变的date与DATE 是的它区分大小写就像 UNIX 的其余部分一样 date and DATE是两个不同的变量 makefile and Makefile是两个不同的文件 h and H是
前导点的自动完成功能无法快速工作

当我尝试在 swift 中使用前导点语法时我没有得到任何自动完成建议是否没有实现此自动完成功能或者是我的 Xcode 版本 6 3 1 有问题例如当我尝试这样的事情时 let col UIColor whiteColor 在我
数据操作 startdate enddate python pandas

我有一个促销描述数据集其中包含有关正在运行的各种促销活动及其开始日期结束日期的信息 promo item start date end date Buy1 get 1 A 2015 01 08 2015 01 12 Buy1 get 1
打印一个字符串，并将其特殊字符打印为文字转义序列

我在 shell bash 脚本中有一个字符串我想打印字符串并将其所有特殊字符例如换行符制表符等打印为文字转义序列例如换行符打印为 n 选项卡打印为 t 等等不确定我是否使用了正确的术语该示例应该能够澄清问题 Exampl
Enthought Python 中的线程 FFT

Numpy SciPy 中的快速傅立叶变换 FFT 不是线程化的 Enthought Python 附带 Intel MKL 数值库该库能够进行线程 FFT 如何获得这些例程以下代码适用于 Windows 7 Ultimate 64 位
Cloud Run 是否支持服务器发送事件 (SSE)？

我们无法让 SSE 从 Google Cloud Run 上的容器发送我尝试过仅使用一个简单的 SSE 示例来托管容器 https github com kljensen node sse example https github com
debugger-ruby_core_source gem 没有提供 ruby-2.0.0-p451 的源代码

我在其他 SO 问题中看到了非常类似的问题例如debugger ruby core source gem 没有提供 ruby 1 9 2 p321 的源代码 https stackoverflow com questions 204618
AVFoundation 在后台/锁屏上播放音频 Swift

我正在尝试找到一种使用 AVFoundation 在用户处于锁定屏幕上或在使用我的应用程序期间锁定应用程序时播放音频的方法 class ViewController UIViewController AVAudioPlayerDelegat
如何在 Presto 中删除重复数据

我有一个 Presto 表假设它有 id name update time 列和数据 1 Amy 2018 08 01 1 Amy 2018 08 02 1 Amyyyyyyy 2018 08 03 2 Bob 2018 08 01 现在
如何通过ajax点击时从javascript文件执行节点（控制台）命令

我是 Node js 新手这是我的问题例如我得到了 Web 应用程序并且从该应用程序中我有一个按钮单击按钮后我想运行节点控制台命令例如 node socket io So button on click function run
如果在 React JS 中选中复选框，如何隐藏或显示 div

我如何在React JS中根据复选框状态选中未选中显示隐藏div 我对React很陌生我知道如何在jquery中执行此操作但在React上是另一种方法提前致谢 EDITED 如果选中或未选中该复选框则想要显示隐藏带有 cl
F# 参数传递

我一直认为 F 有两种不同的方式来传递参数柯里化风格和元组风格这实际上是正确的吗是不是很简单一种风格柯里化风格和参数可以是简单值或元组 e g someFunc a b 这不是一个函数吗one咖喱风格的参数恰好是一个元组因此允许我
错误此 PlotModel 已被 OxyPlot 图表中的某些其他 PlotView 控件使用

我正在使用 Xamarin Forms OxyPlot 图表我有一个 CollectionView 每个 CollectionView 项都有一个扩展器每个扩展器内部都有一个 PlotView
查找“”之间的字符串的正则表达式是什么

我有一个字符串如下 http 172 1 10 1 3 http 192 168 15 2 6 http 192 168 1 100 1 2 8 内的字符串是一个标签内的字符串是前面标签的值返回我的正则表达式是什么标签 http 17
Git Grep 颜色选项解释和/或比较

我正在尝试自定义我的 Git 颜色读完后文档 https git scm com docs git config 我找到了我想要设置的选项除了 Grep 之外一切都工作正常我意识到我过去并没有真正使用过它我想用相同的调色板为其设
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in

Pytorch 损失为 nan

Pytorch 损失为 nan 的相关文章

随机推荐

热门标签