在向后传递中调试 nan

2024-01-09

我正在尝试调试一个有点复杂且非规范的神经网络架构。计算前向传递很好，并且给了我预期的结果，但是当我尝试使用 Adam 或任何标准优化器进行优化时，即使在学习率非常小的一次迭代之后，我到处都得到 nan。我正在尝试对它们进行本地化，并且想知道是否有一种方法可以捕获 nan 的第一次出现并检测它出现在哪个操作中？我试过tf.add_check_numerics_ops()但它似乎没有做任何事情，或者也许我使用不正确。

调试 NaN 可能很棘手，特别是如果您有一个大型网络。tf.add_check_numerics_ops() https://www.tensorflow.org/api_docs/python/tf/compat/v1/add_check_numerics_ops向图中添加操作，断言图中的每个浮点张量不包含任何 NaN 值，但默认情况下不运行这些检查。相反，它返回一个可以定期运行或在每个步骤上运行的操作，如下所示：

train_op = ...
check_op = tf.add_check_numerics_ops()

sess = tf.Session()
sess.run([train_op, check_op])  # Runs training and checks for NaNs

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

在向后传递中调试 nan 的相关文章

提交用于 Tensorflow 对象检测的 Google Cloud ML 训练作业时出现错误消息

尝试提交 Tensorflow 对象检测任务的 Google Cloud ML 训练作业我正在遵循官方指南 https github com tensorflow models blob master research object de
张量流 - 向量中的前 k 个值到二进制向量

假设我有一个带有值的向量 0 4 1 2 8 7 0 2 如何获得前 k 个值的二进制向量 k 3 0 1 0 0 1 1 0 0 in 张量流 TensorFlow 的tf math top k https www tensorflow
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
如何在 TensorFlow 中访问原型中的值？

我从tutorial https www tensorflow org extend tool developers 我们可以这样做 for node in tf get default graph as graph def node pr
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
使用预训练（Tensorflow）CNN 提取特征

深度学习已成功应用于多个大型数据集用于对少数类别猫狗汽车飞机等进行分类其性能优于 SIFT 特征袋颜色直方图等更简单的描述符然而训练这样的网络需要每个类别大量的数据和大量的训练时间然而在花时间设计和训练这样一种设备并
Scipy 稀疏 CSR 矩阵到 TensorFlow SparseTensor - 小批量梯度下降

我有一个 Scipy 稀疏 CSR 矩阵它是根据 SVM Light 格式的稀疏 TF IDF 特征矩阵创建的特征数量巨大且稀疏所以我必须使用 SparseTensor 否则速度太慢例如特征数量为 5 示例文件如下所示 0 4 1
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
Keras - Nan 总结直方图 LSTM

我使用 Keras 编写了一个 LSTM 模型并使用 LeakyReLU 高级激活 ADAM Optimizer with learning rate decay opt optimizers Adam lr 0 0001 beta 1
张量流输入管道，其中多行对应于单个观察？

所以我刚刚开始使用 Tensorflow 并且我正在努力正确理解输入管道我正在研究的问题是序列分类我正在尝试读取形状为 100000 4 的 CSV 文件前 3 列是特征第四列是标签但是数据表示长度为 10 的序列即第 1 1
GPU 上的 AWS SageMaker [已关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在尝试在 AWS 上训练神经网络 Tensorflow 我有一些 AWS 积分据我了解 AWS
Colab 上没有名为“tensorflow.compat.v2”的模块

我正在关注这个https thebinarynotes com how to train mask r cnn on the custom dataset https thebinarynotes com how to train mask
为什么使用“self”定义的变量在继承自 tf.keras.Model 时会自动给出 ListWrapper() ？

我不熟悉ListWrapper 但它被应用于使用创建的所有列表变量self当我的班级继承自tf keras Model https www tensorflow org api docs python tf keras models Mod
在 Tensorflow 中学习新单词嵌入时进行地面预训练嵌入

我尝试使用以下代码片段为预训练的嵌入奠定基础并仅针对新词汇学习嵌入但预定义单词的嵌入也发生了变化 None
每次运行神经网络代码时结果都会改变

我通过运行此链接中提供的代码得到了结果神经网络预测多个变量的值 https stackoverflow com questions 58071836 neural network predicting values of multiple
如何在 keras 模型中使用张量流度量函数？

使用Python 3 5 2张量流RC 1 1 我正在尝试在 keras 中使用张量流度量函数所需的功能接口似乎是相同的但调用 import pandas import numpy import tensorflow contrib k
打印出网络架构中每一层的形状

在 Keras 中我们可以如下定义网络有什么办法可以输出每层之后的形状例如我想打印出以下形状inputs在定义行之后inputs 然后打印出形状conv1在定义行之后conv1 etc inputs Input 1 img rows
尝试校准keras模型

我正在尝试通过 Sklearn 实现来校准我的 CNN 模型CalibratedClassifierCV 尝试将其包装为KerasClassifier并覆盖预测功能但没有成功有人可以说我做错了什么吗这是模型代码 def create m
张量流中有哪些资产？

我正在阅读有关保存和恢复模型的张量流教程并遇到以下声明 If assets need to be saved and written or copied to disk they can be provided when the firs

随机推荐

HttpUrlConnection 是否会审查某些标头，尤其是 Origin？

我正在尝试为实现 CORS 的 Web 服务创建一些测试所以我需要发送 Origin 标头当我打电话时addRequestProperty origin origin 原始标头似乎没有出现在服务器上我说似乎我有一个 servle
字符串生成器与字符串连接[重复]

这个问题在这里已经有答案了与纯字符串连接相比使用字符串生成器有什么好处和权衡 new StringBuilder 32 append str1 append test append val append is changed toStr
如何手动上传我的源代码到哨兵？

我的应用程序是用 expo 构建的哨兵仪表板显示了 2 个错误丢弃无效参数类型 and 找不到 app crna entry bundle 的源代码平台 ios dev true minify false hot false ass
Javascript - 在继续之前等待事件

我正在尝试创建一个可以执行以下操作的 JavaScript 函数 onclick 浮动div中的表单弹出这部分没问题然后脚本如何等待数据输入到表单中然后再返回表单中的值你可以说我正在尝试创建我自己的 javascript 提示版本
类成员函数的函数模板特化

include
存储过程的字符串参数的最大长度是多少？

我有一个长度为 1 44 000 的字符串必须将其作为参数传递给存储过程该存储过程是表上的选择查询当给定这是在查询中在 c 中时它工作正常但是当我将它作为参数传递给存储过程时它不起作用这是我的存储过程其中我已将此参数声明
如何创建自己的域名后缀？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案 Like bit ly goo gl is gd j mp migre me等使用自己的域名扩展 ly gl gd mp me等等我如何创建自己的个
ElasticSearch Spring - 使用 @Mapping 注释仅对一组字段禁用 date_detection，而不是对整个索引

我正在尝试禁用索引中一组字段的 date detection 下面是映射 my index mappings properties class type text fields keyword type keyword ignore abo
Android YouTube 播放器 api 发生大量崩溃

我正在使用 1 2 1 版本尝试过最新版本 1 2 2 android s youtube player api 它在大多数设备上运行良好然而我时不时地会在 crashlytics 上遇到崩溃我遇到以下崩溃 Fatal Except
Java 中的 try、catch、finally 中的 return 是如何工作的？

我不明白到底如何return工作于try catch 如果我有try and finally没有catch 我可以把return在的里面try block 如果我有try catch finally 我不能放return in the t
如何获得 PHP 数组中下一个值和上一个值之间的减法[重复]

这个问题在这里已经有答案了我有这样的数据数组 array 0 0 0 19 0 5 0 75 1 0 1 25 1 5 1 75 2 0 2 25 我想要得到的是下一个值和上一个值之间的绝对减值数组 0 0 0 19 0 19 0 5 0
使用 AWS 负载均衡器的 A（主机）记录

我有关于 AWS 负载均衡器的问题我可以指点我的CNAMEwww 完美地连接到我的负载均衡器的 DNS 我知道它将始终有效但我还需要将记录指向负载均衡器以便人们可以访问mysite com代替www mysite com并点击负载均
Haskell 在计算字母方面能打败 C 吗？

剧透是的见下文尝试优化字母计数器以匹配 C 我已经与它斗争到了 2 倍的赤字 letterCount B ByteString gt V Vector Int letterCount bs V accumulate a gt a 1
带块的 File.open 与不带块的 File.open

我有一个关于 Block 的问题这两个代码的含义相同吗 code 1 File open yozloy txt w do f f lt lt Some contains end code 2 newFile File open yozlo
添加标签覆盖谷歌地图

我成功添加信息窗口
响应式 HTML 电子邮件可以使用手风琴吗？

我的客户想要一封响应式电子邮件其中文本未完全显示但已嵌入电子邮件正文中当用户单击单击更多时文本会展开并且所有文本都变得可见那可能吗据我所知伪类在电子邮件客户端上是不可能的并且使用内联编码构建手风琴在技术上非常困难有任何
AS3敌人双倍速度？

我使用 AS3 和 Air 3 2 for Android 在 Flash CS6 中制作了一个游戏现在这个游戏你会进入不同的菜单当你死后它会返回主菜单并显示你的分数现在当你选择一个新角色并玩时再次穿越怪物速度翻倍知道为什么吗
如何使用 proc http 和 http_tokenauth 在后台调用 SAS STP

我正在尝试使用选项后台通过 proc http 从 SAS 调用存储进程 STP 以确保我的主进程不会等待 STP 完成我确实使用以下代码 filename resp
Idris：函数使用 Nat 参数，但使用 Integer 参数时类型检查失败

我是伊德里斯的新手我正在尝试类型我的任务是制作一个洋葱一个带有两个参数的函数一个数字和任何东西并将任何东西放入List嵌套了这么多次例如结果为mkOnion 3 Hello World 应该 Hello World 我做了这
在向后传递中调试 nan

我正在尝试调试一个有点复杂且非规范的神经网络架构计算前向传递很好并且给了我预期的结果但是当我尝试使用 Adam 或任何标准优化器进行优化时即使在学习率非常小的一次迭代之后我到处都得到 nan 我正在尝试对它们进行本地化并且想知道

在向后传递中调试 nan

在向后传递中调试 nan 的相关文章

随机推荐

热门标签