张量流是否通过pdf传播梯度

2024-03-27

可以说，分布函数定义如下：

dist = tf.contrib.distributions.Normal(mu, sigma)

并从分布中抽取样本

val = dist.pdf(x)

并且该值在模型中用于预测变量

X_hat = f(val)
loss = tf.norm(X_pred-X_hat, ord=2)

如果我想优化变量 mu 和 sigma 以减少预测误差，我可以执行以下操作吗？

train = tf.train.AdamOptimizer(1e-03).minimize(loss, var_list=[mu, sigma])

我有兴趣知道梯度例程是否通过正态分布传播，或者我应该期待一些问题，因为我正在定义分布的参数上获取梯度

tl;dr:是的，梯度反向传播可以正常工作tf.distributions.Normal.

dist.pdf(x)不从分布中抽取样本，而是返回概率密度函数x。这可能不是您想要的。

要获得随机样本，您真正想要的是调用dist.sample()。对于许多随机分布，随机样本对参数的依赖性是重要的，并且不一定是可反向传播的。

然而，正如 @Richard_wth 指出的那样，特别是对于正态分布，可以通过重新参数化来获得对位置和尺度参数的简单依赖（mu and sigma).

事实上，在实施 https://github.com/tensorflow/tensorflow/blob/b7e38a5f2a310599e9d4cab2bd95a43dd18018d6/tensorflow/python/ops/distributions/normal.py#L186 of tf.contrib.distributions.Normal（最近迁移到tf.distributions.Normal），这正是如何sample已实施：

def _sample_n(self, n, seed=None):
  ...
  sampled = random_ops.random_normal(shape=shape, mean=0., stddev=1., ...)
  return sampled * self.scale + self.loc

因此，如果您提供尺度和位置参数作为张量，则反向传播将在这些张量上正确工作。

请注意，这种反向传播本质上是随机的：它将根据正常高斯变量的随机抽取而变化。然而，从长远来看（通过许多训练示例），这可能会如您所期望的那样工作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

张量流是否通过pdf传播梯度的相关文章

整数或布尔值的 TensorFlow 占位符变量不起作用

我在 TensorFlow 中使用以下代码片段有条件地从一个或另一个源提取数据 if name main with tf device gpu 0 with tf Graph as default with tf variable scop
使用所需的优化标志重新构建 Tensorflow

预先感谢您的考虑我刚刚使用以下命令安装了tensorflow 在已安装Ubuntu 16 04和CUDA 8 0的新机器上程序 http www nvidia com object gpu accelerated application
TensorFlow 设备上下文、流和上下文切换

In the GPU设备 https github com tensorflow tensorflow blob master tensorflow core common runtime gpu gpu device cc L264代码
在tensorboard中创建日志目录

我正在尝试学习如何使用张量板我希望它在我的程序中运行我不明白如何创建日志目录这些是我运行张量板的线路 summary writer tf train SummaryWriter tensorflow logdir sess graph
模块“tensorflow._api.v2.train”没有属性“GradientDescentOptimizer”

我使用Python 3 7 3并安装了tensorflow 2 0 0 alpha0 但是存在一些问题例如模块 tensorflow api v2 train 没有属性 GradientDescentOptimizer 这是我的全部代码
Tensorflow - 保存模型

我有以下代码在尝试保存模型时出现错误我可能做错了什么我该如何解决这个问题 import tensorflow as tf data labels cifar tools read data C Users abc Desktop Te
如何实现固定长度的空间金字塔池化层？

我想实现所介绍的空间金字塔池层在本文中 https arxiv org pdf 1406 4729v4 pdf 正如论文设置关键点是定义 max pooling 层的变体内核大小和步幅大小即 kernel size ceil a n s
如何在最新版本的 Tensorflow 中使用 MultiVariateNormal 分布

I need to use the MultiVariateNormal distribution from the tf contrib distributions MultivariateNormal However in the la
InvalidArgumentError：ConcatOp：输入的维度应该匹配

Tensorflow 1 7使用dynamic rnn时一开始运行良好但在第32步当我运行代码时它发生变化时出现错误当我使用较小的批次时代码似乎可以运行更长时间但是错误仍然弹出只是无法弄清楚出了什么问题 from mapp
在 Numpy 中预处理 Tensorflow 张量

我在 Tensorflow 中设置了一个 CNN 用 TFRecordReader 读取数据它工作得很好但我想做一些比提供的更多的预处理和数据增强tf image功能我特别想做一些随机缩放是否可以在 Numpy 中处理 Tensor
如何使用 tf.data.Dataset.from_generator() 将参数发送到生成器函数？

我想创建多个tf data Dataset使用from generator 功能我想向生成器函数发送一个参数 raw data gen 这个想法是生成器函数将根据发送的参数产生不同的数据这样我想raw data gen能够提供训练验证
TF 数据 API：如何有效地从图像中采样小块

考虑创建从高分辨率图像目录中采样随机小图像块的数据集的问题 Tensorflow 数据集 API 提供了一种非常简单的方法来实现此目的即构建图像名称的数据集对它们进行排序将其映射到加载的图像然后映射到随机裁剪的补丁然而这种幼稚的
来自 .meta .info .data 的 Tensorflow 冻结推理图并组合冻结推理图

我是张量流新手目前正在努力解决一些问题如何在没有管道配置的情况下从 meta data info 获取冻结推理图我想实时检查预先训练的交通标志检测模型模型包含 3 个文件 meta data info 但我找不到信息如何在没有管道
BERT - 池化输出与序列输出的第一个向量不同

我在 Tensorflow 中使用 BERT 有一个细节我不太明白根据文档 https tfhub dev google bert uncased L 12 H 768 A 12 1 https tfhub dev google bert
使用稀疏张量计算梯度时，tensorflow给出nans

以下代码片段来自相当长的一段代码但希望我可以提供所有必要的信息 y2 tf matmul y1 ymask dist tf norm ystar y2 轴 0 y1 和 y2 为 128x30 ymask 为 30x30 ystar 为
使用sklearn宏f1-score作为tensorflow.keras中的指标

我已经为tensorflow keras定义了自定义指标以在每个时期之后计算宏f1分数如下所示 from tensorflow import argmax as tf argmax from sklearn metric import
tensorflow SavedModel - 如何迭代保存

我正在采用新的SavedModel据我所知 API 是未来应该优先于tf train Saver 我想要实现的目标是每次保存一个模型N批次数我想最多保留 20 个已保存的模型显然我可以自己监控这一点但如果tf train Save
用于多输入图像的 VGG16 网络

我正在尝试将 VGG16 网络用于多个输入图像使用具有 2 个输入的简单 CNN 训练该模型给了我一个 acc 大约 50 这就是为什么我想使用 VGG16 这样的既定模型进行尝试这是我尝试过的 imports from keras a
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
如何仅从源代码构建 TensorFlow lite 而不是所有 TensorFlow？

我正在尝试使用 Edgetpu USB 加速器与 Intel ATOM 单板计算机和 C API 进行实时推理 Edgetpu 的 C API 基于 TensorFlow lite C API 我需要包含来自tensorflow lite目

随机推荐

获取parent.location.url - iframe - 从子级到父级

我得到了一个在 iframe 中显示的页面我需要从该页面子页面获取带有js的parent location url 两个站点位于不同的域中我想警报父位置 url 但我收到这个错误权限被拒绝http 父域 http paren
通过 ASP.NET Identity 和 Autofac OWIN 集成进行授权

在这个问题的底部添加了更新我有一个 Web 应用程序它使用 MVC5 和 WebAPI2 以及 Autofac for DI 该应用程序使用 ASP NET Identity 和 oAuth 不记名令牌尽管后者可能不是重点这一切都运
C#：存储百分比，50 还是 0.50？

当在变量中保存百分比值时会优先将它们保存为整数还是分数也就是说变量应该保存 0 到 100 之间的数字还是 0 00 到 1 00 之间的数字在任何一种情况下保存值的变量都是十进制类型我正在交互的数据库恰好将它们存储为 0 到
Ionic 项目中的 GSAP

如何将 GSAP 库导入到 Ionic 项目中只是使用npm 安装 gsap当我通过导入时不起作用 import TweenMax TimelineMax from gsap 我使用打字稿谢谢你不需要打字我在几个项目中使用过它所有
克服 Windows 用户对象句柄限制

我正在寻找在构建重量级 Windows 界面时处理用户对象句柄限制的高级策略请解释您如何使用 SWT 或直接 Windows GUI API 克服或绕过此问题我唯一不感兴趣的是优化小部件使用的策略因为我已经广泛地这样做了但它并没有解
为什么 RefCell:borrow_mut 在短路布尔 AND (&&) 两侧使用时会导致 BorrowMutError？

我为 leetcode 编写了这段代码同一棵树问题 https leetcode com problems same tree use std cell RefCell use std rc Rc Definition for a bina
读取文本文件 - fopen 与 ifstream

谷歌搜索文件输入我发现了两种从文件输入文本的方法 fopen 和 ifstream 下面是两个片段我有一个文本文件其中包含一行其中包含一个我需要读入的整数我应该使用 fopen 还是 ifstream 片段 1 FOPEN FILE
meld - gi.glib.GError：主题中不存在图标“meld-change-apply-right”。安装有什么问题吗？

我已经成功安装了 meld 3 14 2 和所有依赖包通过从源代码编译每个包并且所有包都安装在 NFS 共享上 prefix meld对于融合工具 prefix meld deps对于依赖项最后我调用了该工具我可以看到 GUI 但
隐藏水平滚动条

我的水平滚动条有问题我不想让它出现实际上它只显示在 Chrome 中而不会显示在 Internet Explorer 中我能做些什么我尝试过修改 css 类中的宽度和填充但这也会改变布局测试中的内容是动态的因此它可以垂直溢出
将 Java 类和方法移植到 Android。（文本布局、字体、Graphics2D 等）

我一直在 Android 中尝试并尝试通过 Java 应用程序进行移植以下是我遇到的一些问题希望得到一些指导这是一个相当大的问题而是多个问题然而我并不是盲目地询问他们因为我已经对他们进行了研究并试图运用我的理解我花时间提出
在 SQL Server 中将 COALESCE （或类似的东西）与 GROUP BY 一起使用

我认为我缺少一些关于如何有效使用 GROUP BY 消除冗余记录的基本知识我不断遇到似乎需要使用 COALESCE 的地方但据我所知这不适用于 GROUP BY 示例我有一个表其中包含访问 ID 和访问帐单代码的每种组合以及其他有
使用 Cobertura 和 Jacoco 运行代码覆盖率

我在获取 Maven 插件项目使用调用程序插件进行集成测试的 Sonar 中的集成测试和单元测试的代码覆盖率报告时遇到了一些问题我无法使用默认的 Jacoco 覆盖率工具进行单元测试因为这些工具使用 Powermock 这会导致使用
如何制作逆序的for循环？

编者注这个问题是在 Rust 1 0 发布之前提出的引入了范围运算符该问题的代码不再代表当前的风格但下面的一些答案使用了适用于 Rust 1 0 及更高版本的代码我当时正在玩Rust 示例网站 https rustbyexam
在 DOS/Batch 中，08 小于 1，但 07 大于 1。为什么？

在 DOS 批处理中 if 08 lss 1 echo true 与真相呼应 09也是如此 08和09都小于1 However if 07 lss 1 echo true 不回显任何内容 01至07不小于1 为什么 08年和09年有什么
WebGL 绘制图像

我是 WebGL 新手之前在 Java 中使用过 OpenGL 我一直在尝试编写一个简单的函数该函数以特定的大小和旋转在特定位置绘制图像但在网上搜索了一段时间后我的代码仍然无法运行目前我已经成功绘制了图像但是该图像距离正确的位
如何监听Hyperledger Fabric中的事件（commit事件）？

我们建立了一个结构服务器并将一些事务放入其中我们有一些应用程序将与结构服务器配合这是一个情况应用程序发送交易fabric sdk java or fabric sdk node 面料执行chaincode 结构通知应用程序结果应用
python中函数的精确计时

我正在 Windows 上用 python 编程希望准确测量函数运行所需的时间我编写了一个函数 time it 它接受另一个函数运行它并返回运行所花费的时间 def time it f args start time clock f
ORA-02270: 此列列表没有匹配的唯一键或主键

我有一张表结构是 CREATE TABLE COURSE ACCREDITED COURSE ID VARCHAR2 50 NOT NULL ENABLE ACCREDITATION BODY ID VARCHAR2 50 NOT NUL
如何覆盖 Material-ui 的选项卡选择颜色？

我正在使用 Materialui tabs 主题构建 React 16 13 0 应用程序 https material ui com api tab https material ui com api tab 我在我的组件中创建了这些样式
张量流是否通过pdf传播梯度

可以说分布函数定义如下 dist tf contrib distributions Normal mu sigma 并从分布中抽取样本 val dist pdf x 并且该值在模型中用于预测变量 X hat f val loss tf n

张量流是否通过pdf传播梯度

张量流是否通过pdf传播梯度 的相关文章

随机推荐

热门标签

张量流是否通过pdf传播梯度的相关文章