使用稀疏张量计算梯度时，tensorflow给出nans

2024-04-26

以下代码片段来自相当长的一段代码，但希望我可以提供所有必要的信息：

y2 = tf.matmul(y1,ymask)

dist = tf.norm(ystar-y2,轴=0)

y1 和 y2 为 128x30，ymask 为 30x30。 ystar 为 128x30。距离为 1x30。当 ymask 是单位矩阵时，一切正常。但是当我将其设置为全零时，除了沿对角线的单个 1 之外（以便将 y2 中除一列之外的所有列设置为零），我使用 tf.梯度（距离，[y2]）。 dist 的具体值为 [0,0,7.9,0,...]，第三列中所有 ystar-y2 值均在 (-1,1) 范围内，其他位置为零。

我很困惑为什么这里会出现数字问题，因为没有日志或分区，这是下溢吗？我在数学中遗漏了什么吗？

就上下文而言，我这样做是为了尝试使用整个网络一次训练 y 的各个维度。

要重现的更长版本：

import tensorflow as tf
import numpy as np
import pandas as pd

batchSize = 128
eta = 0.8
tasks = 30
imageSize = 32**2
groups = 3
tasksPerGroup = 10
trainDatapoints = 10000

w = np.zeros([imageSize, groups * tasksPerGroup])
toyIndex = 0
for toyLoop in range(groups):
    m = np.ones([imageSize]) * np.random.randn(imageSize)
    for taskLoop in range(tasksPerGroup):
        w[:, toyIndex] = m * 0.1 * np.random.randn(1)
        toyIndex += 1

xRand = np.random.normal(0, 0.5, (trainDatapoints, imageSize))
taskLabels = np.matmul(xRand, w) + np.random.normal(0,0.5,(trainDatapoints, groups * tasksPerGroup))
DF = np.concatenate((xRand, taskLabels), axis=1)
trainDF = pd.DataFrame(DF[:trainDatapoints, ])

# define graph variables
x = tf.placeholder(tf.float32, [None, imageSize])
W = tf.Variable(tf.zeros([imageSize, tasks]))
b = tf.Variable(tf.zeros([tasks]))
ystar = tf.placeholder(tf.float32, [None, tasks])
ymask = tf.placeholder(tf.float32, [tasks, tasks])
dataLength = tf.cast(tf.shape(ystar)[0],dtype=tf.float32)

y1 = tf.matmul(x, W) + b
y2 = tf.matmul(y1,ymask)
dist = tf.norm(ystar-y2,axis=0)
mse = tf.reciprocal(dataLength) * tf.reduce_mean(tf.square(dist))
grads = tf.gradients(dist, [y2])

trainStep = tf.train.GradientDescentOptimizer(eta).minimize(mse)

# build graph
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

randTask = np.random.randint(0, 9)
ymaskIn = np.zeros([tasks, tasks])
ymaskIn[randTask, randTask] = 1
batch = trainDF.sample(batchSize)
batch_xs = batch.iloc[:, :imageSize]
batch_ys = np.zeros([batchSize, tasks])
batch_ys[:, randTask] = batch.iloc[:, imageSize + randTask]

gradOut = sess.run(grads, feed_dict={x: batch_xs, ystar: batch_ys, ymask: ymaskIn})

sess.run(trainStep, feed_dict={x: batch_xs, ystar: batch_ys, ymask:ymaskIn})

这是一个非常简单的复制：

import tensorflow as tf

with tf.Graph().as_default():
  y = tf.zeros(shape=[1], dtype=tf.float32)
  dist = tf.norm(y,axis=0)
  (grad,) = tf.gradients(dist, [y])
  with tf.Session():
    print(grad.eval())

Prints:

[ nan]

问题是tf.norm计算sum(x**2)**0.5。梯度为x / sum(x**2) ** 0.5（参见例如https://math.stackexchange.com/a/84333 https://math.stackexchange.com/a/84333），所以当sum(x**2)是零，我们要除以零。

对于特殊情况，没有什么可做的：梯度为x接近全零取决于它从哪个方向接近。例如如果x是单元素向量，极限为x接近 0 可能是 1 或 -1，具体取决于它从零的哪一侧接近。

所以就解决方案而言，你可以添加一个小的epsilon:

import tensorflow as tf

def safe_norm(x, epsilon=1e-12, axis=None):
  return tf.sqrt(tf.reduce_sum(x ** 2, axis=axis) + epsilon)

with tf.Graph().as_default():
  y = tf.constant([0.])
  dist = safe_norm(y,axis=0)
  (grad,) = tf.gradients(dist, [y])
  with tf.Session():
    print(grad.eval())

Prints:

[ 0.]

请注意，这实际上不是欧几里得范数。只要输入远大于epsilon.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

使用稀疏张量计算梯度时，tensorflow给出nans 的相关文章

在pyspark lambda映射函数中使用keras模型

我想使用该模型来预测 PySpark 中的映射 lambda 函数的分数 def inference user embed item embed feats user embed item embed dnn model load mode
AttributeError：“模块”对象没有 tf.app.run() 的属性“main”

我正在尝试测试一个简短的程序该程序非常简单如下所示 import numpy as np import tensorflow as tf flags tf app flags FLAGS flags FLAGS import tenso
TensorFlow：张量不是该图的元素

file for inputing the data for testing from scipy import ndimage image file test png image data ndimage imread image fil
Odroid XU4 上的 Tensorflow 编译

我正在尝试在 Odroid XU4 16GB eMMc Ubuntu 16 上编译 Tensorflow 尝试了完整和精简版但出现如图所示的错误 https www dropbox com sh j86ysncze1q0eka AAB8R
导入错误：无法导入名称“transpose_shape”

我正在学习 Coursera Andrew Ng 的深度学习课程使用 YOLO 算法进行对象检测我尝试使用 Windows 和 Anaconda Navigator 在我的 PC 上运行该算法我安装了 Keras 以在 TensorF
在 Tensorboard 中获取简单的绘图

我正在尝试在张量板上画一个简单的图就像他们在主页上一样如下所示 To understand how this is working I ve wrote the following import tensorflow as tf imp
如何使用 Keras 将图像文件夹转换为 X 和 Y 批次？

假设我有一个图像文件夹例如 PetData Dog images Cat images 我如何将其转换为 x train y train x test y test 格式我看到这种格式广泛用于 MNIST 数据集如下所示 mnist
在 jupyter 中找不到 Tensorboard 作为魔法函数

我想使用最新的tensorflow 2 0 0a0在jupyter中运行tensorboard 使用tensorboard版本1 13 1和python 3 6 using tensorboard logdir logs base dir
softmax_cross_entropy_with_logits和loss.log_loss有什么区别？

之间的主要区别是什么tf nn softmax cross entropy with logits and tf losses log loss 两种方法都接受 1 hot 标签和 logits 来计算分类任务的交叉熵损失这些方法在理论上
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
没有名为“_pywrap_tensorflow_internal”的模块

在尝试验证tensorflow gpu的安装时在尝试执行 import tensorflow as tf 时出现ImportError 我在 Windows 7 上使用 Quadro K620 Tensorflow 是使用 pip 安装的
Keras 模型中的 Softmax 采样

我考虑过的一些方法继承自 Model 类在tensorflow keras中采样softmax https stackoverflow com questions 52732145 sampled softmax in tensorflo
如何在 Tensorflow 中计算 Spearman 相关性

Problem 我需要计算 Pearson 和 Spearman 相关性并将其用作张量流中的指标对于皮尔逊来说这是微不足道的 tf contrib metrics streaming pearson correlation y pre
tf.print 什么时候才能真正按预期工作（即打印张量和变量的值）？

首先我使用的是TensorFlow 2 0 我只关心这个版本或更高版本而且我已经太关心这样一个只会产生头痛的软件了 The TensorFlow 文档 https www tensorflow org api docs python t
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
Colab TPU 调用 model.fit() 时出错：UnimplementedError

我正在尝试分类cifar10 图片 https www tensorflow org datasets catalog cifar10与谷歌 colab TPU 合作根据官方教程 https www tensorflow org guid
张量流中是否存在无操作（传递）操作？

正如标题所示我想利用这样的操作来重命名节点并更好地组织图表或者是否有其他推荐的做法来重命名图中的现有节点谢谢有tf no op https www tensorflow org api docs python tf no op它允许
张量流多元线性回归不收敛

我正在尝试使用张量流训练具有正则化的多元线性回归模型由于某种原因我无法获取以下代码的训练部分来计算我想要用于梯度下降更新的误差我在设置图表时做错了什么吗 def normalize data matrix averages np av
从 keras 模型中将特征提取到数据集中

我使用以下代码由here https github com keras team keras blob master examples mnist cnn py 运行 CNN 来训练 MNIST 图像 from future import
TensorFlow 未编译为使用 SSE（等）指令，但这些指令是可用的

我第一次使用一些示例代码运行 TensorFlow 运行代码时我收到以下警告有谁知道为什么会发生这种情况以及如何解决它 2017 03 31 02 12 59 346109 W c tf jenkins home workspace re

随机推荐

如何在c中创建信号量？

我正在尝试重新创建一个黑盒库在我的计算机科学课程中当我们应该使用信号量时在我们的纸质期末考试中我们会得到一个 sem h 文件有 3 个函数一个用于创建具有初始数量令牌的新信号量一个用于从信号量中取出令牌一个用于将令牌放
Bootstrap 模态和传递值

当我单击编辑时 id 应该传递到自己的页面并且模式应该弹出但这不起作用请帮我 PHP 和 Bootstrap tr td td td a href gt Edit a td tr Modal div class modal fade
使用 iTextSharp 和 PDFStamper 在 PDF 中使用不同的字体

我正在使用 iTextSharp 加载现有 PDF 并使用 PdfStamper 添加文本我想要完全控制文本这意味着我想要能够控制字体仅限 TrueType 字体大小和坐标现在我使用 ShowTextAligned 将文本添加到某
根据文档，Django 1.8spectdb 命令看不到 PostgreSQL 视图

我有一个带有 PostgreSQL 数据库的 Django 1 8 应用程序我从命令行运行 django inspectdb 来检查模型的视图但视图不会显示在模型输出中这是版本输出 17 36 python well manage p
NSPredicate：获取每种类型之一

我想创建一个NSFetchRequest对于这样的对象 The Object is Car其中有一个attribute color 我有四辆车 car1 color red car2 color red car3 color blue ca
将数字格式设置为缩写数字

我有一个数据库其中有一列包含数字格式的值例如 5 000 for 5k 86 600 for 86 6k 4 100 000 for 4 1m 在浏览器中显示时它应该显示为 5000 的 5k 86 600 的 86 6k 等我需要
来自 URL 的 YouTube 视频 ID - Swift3

基本上我有一个 Youtube URL 作为字符串我想从该 URL 中提取视频 ID 我在 Objective C 中找到了一些代码如下所示 NSError error NULL NSRegularExpression regex NS
Android 中的导航抽屉和 Activity

我正在尝试中给出的导航抽屉幻灯片菜单本教程 http www androidhive info 2013 11 android sliding menu using navigation drawer 上面的链接和我的链接的区别在于我
如何在Elastic Beanstalk服务器上模拟发送周期性任务？

我已经设置了 Elastic Beanstalk 服务器工作层它有一个 cron yaml 每小时运行一个任务如下所示 version 1 cron name broadcast users url broadcast schedul
有没有办法忽略 firebase crashlytics 统计数据中的静音/无声崩溃？

Firebase crashlytics 可以选择静音我们认为无效或将由第三方库修复的崩溃但我认为在计算无崩溃百分比等统计数据时仍然会考虑到这些崩溃有没有一种方法可以标记崩溃使其完全被忽略或丢弃并且不考虑任何这些统计数据计算这不
从数据框中删除稀有因子水平的优雅方法

我想按因子对数据框进行子集化我只想保留高于特定频率的因子水平 df lt data frame factor c rep a 5 rep b 5 rep c 2 variable rnorm 12 此代码创建数据框 factor vari
Flask SqlAlchemy 连接两个模型，无需外键 MYSQL

我正在加入两个没有外键的模型 Models class Users db Model tablename Users userName db Column db String primary key True lastLogin db Co
在连接中使用聚合函数时如何使用 Group By 子句？

我想连接三个表并计算表 A 的总和数量我尝试了一些东西得到了想要的输出但我仍然对聚合函数和 Group By 子句感到困惑在通过连接两个或多个表来计算总和值时我们需要在 Group By 子句中提及哪些列以及为什么需要给出这些列
java.io.Console - 类似于与标准输入重定向兼容的实用程序？

某些 Java 库中是否有实用程序类提供类似的便利设施java io Console http docs oracle com javase 6 docs api java io Console html但与输入的 Bash 管道重定向兼容
Celery 和 transaction.atomic

在一些 Django 视图中我使用这样的模式来保存对模型的更改然后根据新的模型数据进行一些异步更新例如生成图像进一步更改模型 mytask是一个芹菜任务 with transaction atomic mymodel save my
Laravel 5.4 - 使用正则表达式进行验证[重复]

这个问题在这里已经有答案了以下是我的项目名称规则 this gt validate request projectName gt required regex a zA z d u 我正在尝试添加规则使其必须以来信a z or A z可
如何使用 Adobe Flash Builder 4.5 启动移动 Flex Google 地图应用程序？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是 Adob e Flex 开发新手如何使用 Flash Builder 4 5 在 Adob e Flex 的移动 Flex 应
确定 Jenkins 脚本化管道中的失败阶段

我正在寻找一种通用方法来确定 Jenkins 脚本化管道末尾失败阶段的名称请注意这不同于确定 Jenkins 声明性管道中的失败阶段 https stackoverflow com questions 43439093 determin
Swift：扩展 [?] 来生成 [?] 可能吗？

在 Swift 中我有一个具有以下基本前提的自定义结构一个包装结构体可以包含符合以下条件的任何类型BinaryInteger如Int UInt8 Int16等 protocol SomeTypeProtocol associatedt
使用稀疏张量计算梯度时，tensorflow给出nans

以下代码片段来自相当长的一段代码但希望我可以提供所有必要的信息 y2 tf matmul y1 ymask dist tf norm ystar y2 轴 0 y1 和 y2 为 128x30 ymask 为 30x30 ystar 为

使用稀疏张量计算梯度时，tensorflow给出nans

使用稀疏张量计算梯度时，tensorflow给出nans 的相关文章

随机推荐

热门标签