张量流在梯度计算过程中如何处理不可微节点？

2024-04-14

我理解自动微分的概念，但找不到任何解释张量流如何计算不可微函数的误差梯度，例如tf.where在我的损失函数中或tf.cond在我的图表中。它工作得很好，但我想了解张量流如何通过这些节点反向传播误差，因为没有公式可以计算它们的梯度。

如果是tf.where，你有一个具有三个输入的函数，条件C, 真实值T和 false 的值F，和一个输出Out。梯度接收一个值并且必须返回三个值。目前，没有为该条件计算梯度（这几乎没有意义），因此您只需要计算梯度T and F。假设输入和输出是向量，想象一下C[0] is True. Then Out[0]来自T[0]，并且它的梯度应该传播回来。另一方面，F[0]会被丢弃，所以它的梯度应该为零。如果Out[1] were False，那么梯度为F[1]应该传播但不适合T[1]。所以，简而言之，对于T你应该传播给定的梯度，其中C is True并使其为零False，则相反F。如果你看梯度的实现tf.where (Select手术） https://github.com/tensorflow/tensorflow/blob/v1.12.0/tensorflow/python/ops/math_grad.py#L1112-L1118，它正是这样做的：

@ops.RegisterGradient("Select")
def _SelectGrad(op, grad):
  c = op.inputs[0]
  x = op.inputs[1]
  zeros = array_ops.zeros_like(x)
  return (None, array_ops.where(c, grad, zeros), array_ops.where(
      c, zeros, grad))

请注意，输入值本身并不用于计算，这将通过生成这些输入的操作的梯度来完成。为了tf.cond, 代码有点复杂 https://github.com/tensorflow/tensorflow/blob/v1.12.0/tensorflow/python/ops/control_flow_grad.py#L95-L138，因为相同的操作（Merge）在不同的上下文中使用，并且tf.cond还使用Switch里面的操作。然而，想法是一样的。本质上，Switch操作用于每个输入，因此被激活的输入（如果条件是第一个输入）True否则第二个）获得接收到的梯度，另一个输入获得“关闭”梯度（例如None），并且不会进一步传播回来。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

张量流在梯度计算过程中如何处理不可微节点？的相关文章

为什么需要在 Python 方法中显式使用“self”参数？ [复制]

这个问题在这里已经有答案了当在 Python 中的类上定义方法时它看起来像这样 class MyClass object def init self x y self x x self y y 但在其他一些语言中例如 C 您可以使用
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
来自 pandas 数据帧的烛台图，用日期替换索引

此代码给出了带有移动平均线的烛台图但 x 轴位于索引中我需要 x 轴位于日期中需要做什么改变 import numpy as np import pandas as pd import matplotlib pyplot as plt
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
使用预训练的 word2vec 初始化 Seq2seq 嵌入

我对使用预训练的 word2vec 初始化tensorflow seq2seq 实现感兴趣我已经看过代码了嵌入似乎已初始化 with tf variable scope scope or embedding attention deco
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
如何使用 Python/Django 在 Facebook 中获取（和使用）扩展权限

我正在尝试编写一个简单的应用程序让用户授予我的代码写入其页面的 Facebook 流的权限据我了解它应该很简单让用户单击一个按钮启动一个弹出窗口其中包含我的 Facebook 应用程序中的页面在该页面中他们单击授予的内容流发
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

点冻结与点列表

为什么pip list生成比以下更全面的列表pip freeze pip list feedparser 5 1 3 pip 1 4 1 setuptools 1 1 5 wsgiref 0 1 2 pip freeze feedparse
对于大文件，使用 dataURI 创建 iframe 失败，有解决方法吗？ [复制]

这个问题在这里已经有答案了 function openNewWindow strPreviewId let newWindowViewer window open var index mapPreviewIdWithFile strPrev
同一浏览器中不同用户的 Cookie

网站页面上有一些下拉菜单用户只有在经过身份验证后才能访问此页面我想将此值保存到 cookie 中并在用户返回我的网站时将其设置回下拉菜单将当前选择的下拉选项值保存到 cookie 并稍后检索它不是问题但是如果我由另一个用户在同一
如何在 LaTeX 中扩展文章文档类？

我真的不需要对默认文章文档类进行大量更改我想要的只是重新定义页边距我希望它们在所有页面上都相同但与默认值不同使用扉页在标题页上添加更多元素 title author and date对我来说还不够我想要company和公司lo
Android 版本是否有最小堆大小？

许多帖子都谈到了 Android 堆大小到目前为止我发现最大堆大小的唯一共同点是它至少为 16MB 但这是自 API 3 以来的限制为了使用更多内存人们会建议使用 NDK 或任何超出正常 Android 开发的东西是否有任何 An
如何更改 d3 图例条目间距/对齐方式

我有这样一个传说如您所见每个图例条目的宽度相同相反我希望每个图例条目的宽度根据条目符号和文本的宽度而变化最终我希望前导条目文本的末尾与后续条目符号的开头之间的距离相同换句话说我希望 OA 和加号之间的距离与 OI 和菱形以及
codeigniter 标头中重复的“set-cookie: ci-session”字段

每次在我的控制器中使用 this gt session gt set userdata 或 this gt session gt set flashdata 时另一个相同的 Set Cookie ci session 会添加到 http
外键必须映射到概念侧参与外键关联的某些 AssociationSet 或 EntitySet

我试图在实体框架中使用一对一主详细关系但是我收到此错误从第 254 443 行开始映射片段时出现问题外键约束 options Advanced FK00 从表 options Advanced ProductID 到表 pro
外部 VS2013 构建错误“错误 MSB4019：找不到导入的项目 <路径>”

我使用 CMake 文件从命令 proms 构建一个项目该项目可以找到here http www adobe com devnet xmp html 在构建时我遇到以下错误 C Users User Desktop XMP Toolkit
使用 APISpark Restlet 扩展限制对 Restlet 资源的请求

这是我限制分钟请求数量的代码 MethodAuthorizer ma createMethodAuthorizer ma setNext router FirewallRule rule new PeriodicFirewallCounte
MediaElement 是否仅在嵌入 XAML 代码时才播放？

我有一个声音播放器类根本没有任何视觉效果我正在尝试使用MediaElement播放我的声音在所有的测试项目中 MediaElement嵌入到 XAML 代码中它工作得很好但是在我的纯代码版本中即使文件已完美加载我可以在调试器
如何解密从 Soap UI 5.0.0 中的 WSO2 安全代理服务接收的消息

我正在尝试调用 WSO2 ESB 中的安全代理服务我跟着这个tutorial http tryitnw blogspot com 2013 07 invoking secured esb proxy service html 我已成功调用
继续“F# 中是否存在与 C# 的 nameof(..) 等效的内容？”

参考F 中是否存在相当于 C 的 nameof 的功能 https stackoverflow com questions 48304398 is there an equivalent of cs nameof in f 在以下情况下如何
如何按子类别创建动态子菜单

我正在设置一个菜单Sub menu展示Sub categories 在数据库中我创建了一列isSelected具有布尔数据类型要是Sub categories is isSelected true 它将显示在主页上我想知道如何设置Sub
Ruby 中属于类对象的“@”实例变量和“@@”类变量之间的区别？ [复制]

这个问题在这里已经有答案了根据维基教科书 http en wikibooks org wiki Ruby Programming Syntax Classes Instance Variables one below 是一个实例变量属于类
只允许通过 Passportjs 验证的用户访问受保护的页面

将此代码放置在路由中足以保护页面免受未经身份验证的用户的攻击吗 if req user return res send 401 Not allowed in 您可以使用req isAuthenticated 检查请求是否经过身份验证 fun
在 Emacs 中移动到搜索查找的开始和结束位置

接受搜索时如何将点置于搜索字符串的开头或结尾所以说你执行 C s foobar 当我按 RET 时我希望将光标置于找到的字符串的末尾如果按 C RET 则将光标置于开头 Thanks 尝试这个 defun my isearch exi
Azure Python Flask应用程序-AD身份验证问题

解释起来可能有点复杂所以我会尽力而为目前的解决方案我有一个 python Flask 应用程序它将部署到 Azure 中的应用程序服务我希望用户通过 Azure AD 身份验证登录到应用程序服务为此我使用 ADAL 库因为我
mkbundle 和 GTK#

我正在尝试使用 mkbundle 以便我可以分发 GTK 应用程序而无需用户安装 NET Mono 或 GTK 我已经成功捆绑了一个使用 winforms 的应用程序但由于某种原因当我对 GTK 应用程序执行相同操作时它无法工作这
张量流在梯度计算过程中如何处理不可微节点？

我理解自动微分的概念但找不到任何解释张量流如何计算不可微函数的误差梯度例如tf where在我的损失函数中或tf cond在我的图表中它工作得很好但我想了解张量流如何通过这些节点反向传播误差因为没有公式可以计算它们的梯度如果是t

张量流在梯度计算过程中如何处理不可微节点？

张量流在梯度计算过程中如何处理不可微节点？ 的相关文章

随机推荐

热门标签

张量流在梯度计算过程中如何处理不可微节点？的相关文章