是否可以在 TensorFlow 中仅在一次图形运行中高效地计算每个示例的梯度？

2024-02-23

TD;DR：有没有一种方法可以在一次图形运行中以矢量化形式评估 f'(x1)、f'(x2)、...、f'(xn)？其中 f'(x) 是 f(x) 的导数。

就像是：

x = tf.placeholder(tf.float32, shape=[100])
f = tf.square(x)
f_grad = tf.multiple_gradients(x) # f_grad contains f'(x[0]), f'(x[1]), ...

更具体地说，我正在尝试手动实现黑盒随机变分推理（BBSVI）（我知道我可以使用像Edward http://edwardlib.org/，但我正在尝试自己实现）。在某一时刻，我需要计算 f'(x)g(x) 在 x (x1, x2, ..., xn) 的许多不同值上的平均值，其中 f(x) 和 g(x) 是两个函数，f'(x) 是 f(x) 的导数。

使用 TensorFlow 的 autodiff 功能，我可以通过简单地调用来计算 f'(x1)、f'(x2)、...、f'(xn)f_prime.eval(feed_dict={x: xi})对于 (x1, x2, ..., xn) 中的每个值 xi 一次。这根本没有效率：我想使用矢量化形式，但我不知道如何做到这一点。

也许使用tf.stop_gradient()不知何故？或者使用grad_ys论证中tf.gradients()?

经过一番挖掘，在 TensorFlow 中计算每个示例的梯度似乎并不简单，因为该库执行标准的反向传播来计算梯度（其他深度学习库如 PyTorch、Theano 等也是如此），它实际上从未计算每个示例的梯度，它直接获得每个示例的梯度之和。查看这次讨论 https://github.com/tensorflow/tensorflow/issues/4897更多细节。

然而，有一些技术可以解决这个问题，至少对于某些用例来说是这样。例如，论文高效的每个示例梯度计算 https://arxiv.org/abs/1510.01799Ian Goodfellow 解释了如何有效计算包含平方导数之和的每个示例向量。以下是显示计算的论文摘录（但我强烈建议您阅读这篇论文，它很短）：

该算法是 O(mnp) 而不是 O(mnp²)，其中 m 是示例数，n 是神经网络中的层数，p 是每层神经元的数量。因此，它比简单的方法（即每个示例执行一次反向传播）要快得多，尤其是当 p 很大时，甚至在使用 GPU 时速度更快（这会大大加快矢量化方法的速度）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

是否可以在 TensorFlow 中仅在一次图形运行中高效地计算每个示例的梯度？的相关文章

在 Python 中使用 Selenium 处理“接受 Cookie”弹出窗口

我一直在尝试用硒抓取这个房地产网站的一些信息但是当我访问该网站时我需要接受 cookie 才能继续这仅在机器人访问网站时发生而不是在我手动执行时发生当我尝试通过 xpath 或 id 查找相应的元素时正如我在手动检查页面时找到
Django：如何测试“HttpResponsePermanentRedirect”

我正在为我的 django 应用程序编写一些测试在我看来它使用 HttpResponseRedirect 重定向到其他一些网址那么我该如何测试呢姜戈TestCase类有一个方法assertRedirects https docs d
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
优化 Keras 以使用所有可用的 CPU 资源

好吧我真的不知道我在说什么所以请耐心听我说我正在使用 Theano 后端运行 Keras 以在 MNIST 图像上运行基本的神经网络目前只是一个教程过去我一直使用我的旧 HP 笔记本电脑因为我有 Windows 和 Ubunt
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
如果字段值在外部列表中，Django 会注释布尔值

想象一下我有这个 Django 模型 class Letter models Model name models CharField max length 1 unique True 还有这个列表 vowels a e i o u 我想查询
Python igraph：从图中删除顶点

我正在使用安然电子邮件数据集并尝试删除没有 enron com 的电子邮件地址即我只想拥有安然电子邮件当我尝试删除那些没有 enron com 的地址时一些电子邮件由于某些原因被跳过下面显示了一个小图其中顶点是电子邮件地址这是
具有多个元素的数组的真值是二义性错误吗？ Python

from numpy import from pylab import from math import def TentMap a x if x gt 0 and x lt 0 5 return 2 a x elif x gt 0 5 a
Python：计算数据帧列中所有行中特定字符的实例数

我有一个包含列 toaddress ccaddress body 的数据框 df 我想迭代数据帧的索引以获取 toaddress 和 ccaddress 字段中电子邮件地址的最小最大和平均数量这是通过计算这两列中每个字段中的和的实
将输入发送到 python 子进程而不等待结果

我正在尝试为一段代码编写一些基本测试该代码通常通过 stdin 无休止地接受输入直到给出特定的退出命令我想检查程序是否在给出一些输入字符串时崩溃经过一段时间来考虑处理但似乎无法弄清楚如何发送数据而不是陷入等待我不知道的输出关心我
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
如何将列表字典写入字符串而不是 CSV 文件？

This 堆栈溢出问题 https stackoverflow com questions 37997085 how to write a dictionary of lists to a csv file将列表字典写入 CSV 文件的答案

随机推荐

脚本可以编辑受保护的范围或工作表吗？

我正在使用一个脚本来复制和粘贴一些数据这些数据由几个用户填充而没有权限仅编辑一行其他范围受到这些用户的保护无法编辑该脚本将数据从一张纸复制到另一张纸并且两张纸都受到完全保护除了可以编辑任何内容的两个编辑者之外当没有人处理此电
将嵌入式 Glassfish 与 Maven 结合使用

有人知道嵌入式 Glassfish 吗我想运行一些 EJB 测试但我不想每次运行测试时都启动和停止嵌入的 glassfish 根据插件文档我应该将其放入 POM 中
在移动设备上部署 C++ QML 插件的正确方法是什么？

我经常使用 Box2D QML 插件看起来效果非常好但是我想在 Android SGS2 上部署我的示例应用程序但我似乎无法让它工作无论我尝试在 AVD 上还是在设备上运行它它都不起作用 androiddeployqt 成功完成
嵌套 div 上的 jQuery click()

代码可能比我能更好地解释这一点 div class wrapper div class inner1 div div class inner2 div div 当我点击inner1div 它运行do something 与两个inner1d
为什么我的 PDF 生成为空白？

我正在使用 ItextSharp 和 c asp net MVC 生成 PDF 报告但是当我生成报告时 PDF 返回为空白除了工作正常的标题之外我会喜欢你的意见生成报告的代码如下 using var writer PdfWrite
在 Mac OS X 上以编程方式修改家长控制

Mac OS 具有一组非常基本的家长控制选项允许您限制用户对网站和应用程序的访问以及设置的每日时间限制我希望能够编写脚本来执行如下操作允许上午 8 点至上午 9 30 访问特定网站限制对游戏的访问允许下午 5 点至下午 6 00
如何使错误页面（http 500）在 IceFaces 中工作？

使用 Icefaces 2 如果在标准非icefaces h commandButton 上执行操作方法期间发生错误则该按钮似乎没有任何操作尽管在 web xml 中将其配置为显示错误页面但不会显示错误页面我可以通过将标签包围来使
Sprite/Texture Atlas：GDI+ Bitmap.MakeTransparent 用于 OpenTK 的颜色键

我正在使用 C 和 OpenTK 编写精灵纹理图集功能的支持类到目前为止大多数功能都运行良好正交视图上的简单 2D 图块我的问题与调用 GDI Bitmap MakeTransparent 方法设置颜色洋红色 0xFFFF00F
JavaScript 中 Uint8Array 到图像

我有一个名为的 Uint8ArrayframeBytes 我使用以下代码从该字节数组创建了 RGBA 值 for var i 0 i lt frameBytes length i imgData data 4 i frameBytes i
Safari 中的跨源视频

有谁知道 Safari 是否支持crossoriginHTML5 上的属性
卡夫卡连接|无法反序列化主题数据 |检索 id 的 Avro 键/值架构版本时出错 |未找到主题错误代码：40401

首先感谢 OneCricketeer 迄今为止的支持到目前为止我已经尝试了很多配置我不知道还能尝试什么使用汇合connect standalone worker properties sink properties访问外部流连接正在
如何拥有 JFrame 最大化图标

我如何创建一个JFrameMac 上 eclipse 中的窗口有一个图标可以使窗口全屏显示就像大多数窗口右上角的双箭头图标一样看一眼 OSX Lion 上 Java 应用程序的全屏功能 https stackoverflow com
Java，替换列表中的值

我有以下问题我想用一个方法获取一个列表在该列表中找到一个值并将其替换为另一个值 void replaceAll ArrayList
错误代码 7503 - 应用程序未在我们的商店中注册

我尝试通过 Graph API 接收呼叫信息准确地说我尝试运行文档中的示例 5 但我只收到以下错误 error code UnknownError message errorCode 7503 message Application i
nvm 在哪里存储 node.js 安装？

我找不到通过以下方式下载和安装的 Node js 安装位置 nvm install 5 0 你知道答案吗 nvm which 5 0将为您提供该版本 Node js 的安装路径
尝试评估缺失的嵌套键时，Helm 图表失败，并显示“nil 指针评估接口 {}”

我正在编写一个 Helm 3 库图表并希望创建一个具有默认值的 YAML 但是当尝试设置默认值时nestedkey 不存在 Helm 失败并显示以下错误消息 nil pointer evaluating interface 假设我的 K
Grasshopper 语音 + Twilio 文本

我的公司目前使用 Grasshopper 作为语音系统来接收和路由入站客户支持电话它运行得很好只不过现在是 2014 年人们希望能够通过短信向我们的免费客户支持号码发送问题并获得回复 Grasshopper 不支持接收转发短信所以
使用 TThread.Resume 有什么问题？ [复制]

这个问题在这里已经有答案了很久以前当我开始在 Delphi 中使用线程时我通过调用使线程自行启动TThread Resume在其构造函数的末尾并且仍然这样做如下所示 constructor TMyThread Create con
在两个 JPanel 对象之间发送消息

我有一个包含 JPanel 的 Java JFrame 在该 JPanel 中有两个独立的 JPanel 当用户单击第一个 JPanel 中的按钮时需要向另一个 JPanel 发送一条消息通知它单击了哪个按钮在这样的对象之间发送消息
是否可以在 TensorFlow 中仅在一次图形运行中高效地计算每个示例的梯度？

TD DR 有没有一种方法可以在一次图形运行中以矢量化形式评估 f x1 f x2 f xn 其中 f x 是 f x 的导数就像是 x tf placeholder tf float32 shape 100 f tf square x

是否可以在 TensorFlow 中仅在一次图形运行中高效地计算每个示例的梯度？

是否可以在 TensorFlow 中仅在一次图形运行中高效地计算每个示例的梯度？ 的相关文章

随机推荐

热门标签

是否可以在 TensorFlow 中仅在一次图形运行中高效地计算每个示例的梯度？的相关文章