在张量流中compute_gradients返回什么

2024-01-01

mean_sqr = tf.reduce_mean(tf.pow(y_ - y, 2))
optimizer = tf.train.AdamOptimizer(LEARNING_RATE)
gradients, variables = zip(*optimizer.compute_gradients(mean_sqr))
opt = optimizer.apply_gradients(list(zip(gradients, variables)))

init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

for j in range(TRAINING_EPOCHS):
    sess.run(opt, feed_dict={x: batch_xs, y_: batch_xs})

我不太明白compute_gradients返回什么？它是否为batch_xs分配的给定x值返回sum(dy/dx)，并更新apply_gradients函数中的梯度，例如：
theta

或者它是否已经返回给定批次中每个 x 值求和的梯度平均值，例如 sum(dy/dx)*1/m，m 定义为 batch_size？

compute_gradients(a,b) 返回 d[ sum a ]/db。因此，在您的情况下，这将返回 d Mean_sq / d theta，其中 theta 是所有变量的集合。这个方程中没有“dx”，你不是在计算梯度。输入。那么批次维度会发生什么情况呢？您可以在mean_sq的定义中自行删除它：

mean_sqr = tf.reduce_mean(tf.pow(y_ - y, 2))

因此（为了简单起见，我假设 y 是一维）

d[ mean_sqr ] / d theta = d[ 1/M SUM_i=1^M (pred(x_i), y_i)^2 ] / d theta
                        = 1/M SUM_i=1^M d[ (pred(x_i), y_i)^2 ] / d theta

所以你可以控制它是对批次求和、取平均值还是做不同的事情，如果你将mean_sqr定义为使用reduce_sum而不是reduce_mean，梯度将是批次的总和，依此类推。

另一方面，apply_gradients 只是“应用梯度”，应用的确切规则取决于优化器，对于 GradientDescentOptimizer 来说，它是

theta <- theta - learning_rate * gradients(theta)

对于 Adam 来说，你使用的方程当然更复杂。

Note然而，tf.gradients 在数学意义上更像是“反向传播”而不是真正的梯度 - 这意味着它取决于图依赖性并且不识别“相反”方向的依赖性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

tensorflow

deeplearning

gradient

在张量流中compute_gradients返回什么的相关文章

如何在discord.py中循环任务

我正在尝试制作自己的小不和谐机器人它可以从 Twitch 获取信息但我对如何使机器人循环并检查条件感到困惑我希望机器人每隔几秒循环一段代码检查指定的抽搐频道是否处于活动状态 Code import discord from disc
urllib.error.URLError:

Python 3 4 2 当我在脚本中运行 urllib request urlopen url 时出现了一个奇怪的错误如果我直接在 Python 解释器中运行它它可以正常工作但当我通过 bash shell Linux 在脚本内运
Mypy 产生不兼容的签名错误，但满足里氏替换原则

以下继承结构满足里氏替换原则即在本例中接受任何 kwargs 并且不接受任何非关键字参数 class Parent def mymethod self kwargs gt None print Called Parent mymeth
Keras 显示 GPU 训练速度没有任何改进（部分 GPU 使用？！）

我正在尝试在我的 Jupyter Notebook 的 AWS p2 xlarge 实例上的 GPU 而不是 CPU 上训练我的模型我正在使用tensorflow gpu后端仅tensorflow gpu已安装并在中提到requirem
在 Mac OS 10.14.2 上的 Python 3.7 中安装 JPype1 时出错

我在系统中安装 JPype1 时遇到错误我正在使用Python 3 7 JPype1 是 Jaydebeapi 的依赖项 pip install Jpype1 以下是错误消息 Collecting jpype1 Using cached
如何使用 TFlearn 中的 ImageAugmentation 训练 CNN 中的图像和数据混合

我想使用图像像素信息和数据的混合在 Tflearn Tensorflow 中训练卷积神经网络由于我的图像数量较少因此我需要使用图像增强来增加传递到网络的图像样本数量但这意味着我只能传递图像数据作为输入数据必须在稍后阶段大概在全
在NN中指定连接（在keras中）

我正在使用 keras 和tensorflow 1 4 我想明确指定哪些神经元在两层之间连接因此每当第一层中的神经元 i 连接到第二层中的神经元 j 且其他地方为零时我就有一个矩阵 A 其中包含 1 我的第一次尝试是创建一个带有内核的
仅打印字符串中的元音

我是Python新手我正在尝试打印字符串中的所有元音因此如果有人输入嘿一切都好吗所有元音都需要打印但我不知道怎么做所以这不是计算元音而是打印元音现在我已经得到了这个 sentence input Enter your s
替代 __del__ 来获得最终结果并终止类中的进程？

这个虚拟类类似于我当前的项目 class EndProcess object def init self self Q multiprocessing Queue self p1 multiprocessing Process target
使用 Python 用另一个嵌套 Json 更新嵌套 Json

例如我有一套完整的嵌套 JSON 我需要使用另一个嵌套 JSON 中的最新值来更新此 JSON 谁能帮我这个我想在 Pyspark 中实现这个完整的 Json 看起来像这样 email email protected cdn cgi
为什么 pip 已经是最新的了却要求我升级？

我全新安装了 python 3 7 1 64 位并使用最新的 pyCharm 作为我的 IDE 我在这台机器上没有安装其他 python 我去安装 numpy 并收到以下消息 venv C Users John PycharmProjec
Kivy TextInput 水平和垂直对齐（文本居中）

如何在 Kivy 的 TextInput 中水平居中文本 I have the following screen But I want to centralize my text like this 这是我的 kv 语言的一部分 BoxLa
为什么我无法杀死 k8s pod 中的 python 进程？

我试图杀死一个 python 进程 ps aux grep python root 1 12 6 2 1 2234740 1332316 Ssl 20 04 19 36 usr bin python3 batch run py root 4
Tensorflow DecodeJPEG：预期图像（JPEG、PNG 或 GIF）以“\000\000\000\000\000\000\000\00”开头的格式未知

我正在循环浏览图像文件夹这种情况不断发生 tensorflow python framework errors impl InvalidArgumentError 预期的图像 JPEG PNG或GIF 以 000 000 000 000
使用 Selenium 从 twitter 抓取动态推文

这可能看起来像一个重复的问题但相信我我在 Twitter 上观察到了一些新东西我之前制作了一个 Twitter 抓取工具它使用滚动和等待动态元素来获取给定数量的推文但现在好像不行了它不会抓取超过 10 条推文此外它抓取的推文
Python - 为什么这段代码被视为生成器？

我有一个名为 mb 的列表其格式为 Company Name Rep Mth 1 Calls Mth 1 Inv Totals Mth 1 Inv Vol Mth 2 等等在下面的代码中我只是添加了一个包含 38 个 0 的新列表这
深度学习和传统的人工神经网络机器学习有什么区别？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案您能否简要解释一下两者之间的差异深度学习 https developer nvidia com deep learning和利用神经网
通过子类化 `io.TextIOWrapper` 来子类化文件 - 但它的构造函数有什么签名？

我正在尝试子类化io TextIOWrapper下列的这个帖子 https stackoverflow com a 23796737 974555 虽然我的目标不同以此开始注意动机 https stackoverflow com a
在 pyhf 中针对小信号模型拟合收敛失败

这是我们 pyhf 开发团队最近提出的一个问题认为很好并且值得分享因此我们在这里发布了它的修改版本我正在尝试做一个简单的假设检验pyhf v0 4 0 https pypi org project pyhf 0 4 0 我使用的模型
张量流中有哪些资产？

我正在阅读有关保存和恢复模型的张量流教程并遇到以下声明 If assets need to be saved and written or copied to disk they can be provided when the firs

随机推荐

bootstrap-affix ：affix 下面的 Div“跳”到顶部。如何让它平滑地向后滚动？

已经使用 bootstrap 几天了并对它提供的功能感到惊讶一直在尝试拥有某种标题当用户向下滚动时将其固定在顶部您可以在这里找到我当前的工作 http mp3dj free fr affix site http mp3dj fre
比较 SynchronizationContext

如何比较 SynchronizationContext 看来同一个Dispatcher在使用BeginInvoke时可以创建不同的SynchronizationContext 当我深入研究两个不相等的上下文时我发现调度程序线程 ID
在记事本++中创建新快捷方式

我正在尝试在记事本中添加快捷方式或按钮来调用我当前正在编辑的文件上的外部程序例如假设我有程序 analyzer jar 我想在记事本中创建一个按钮或快捷方式来直接运行命令 cmd K java jar analyzer jar
在 AWS EC2 上添加新的 Spark 工作线程 - 访问错误

我有现有的正在运行的 Spark 集群它是通过以下方式启动的spark ec2脚本我正在尝试按照说明添加新的从站停止集群在 AWS 控制台上在其中一个从属设备上启动更多这样的操作启动集群尽管新实例已添加到同一安全组并且我可
Y 轴中带有长标签的 Recharts 水平条形图的动态高度

如果 YAxis 中的标签太长如何动态更改 Recharts 中的 ResponsiveContainer 的高度这是我的代码
错误：打开模拟器时，在 Windows 8 上找不到抛出的模拟器图像 (avds)

我正在 ionic 框架中制作一个 cordova 应用程序我想在模拟器 somfired 命令中测试它ionic emulate android它引发了以下错误运行命令 ionic emulate android 时 Git Bash
ControlSend 使用 SetKeyDelay, 0, 0 时随机发送错误字符（修改和未修改）

我正在自我回答这个问题因为我在互联网上看到过这个问题但几乎没有有用的答案而且在 Stack Overflow 上也绝对找不到我能找到的解决方案示例代码考虑一下这段代码它只写了几行 shell 命令 0 SetKeyDelay 0
允许多个不同形状的接口作为 TypeScript 返回类型

我有一个函数它接受一些参数并生成将传递到外部进程的对象由于我无法控制最终需要创建的形状因此我必须能够为我的函数采用一些不同的参数并将它们组装成适当的对象这是一个非常基本的示例展示了我遇到的问题 interface T1A type
BuildHTTPClient 无法获取构建定义步骤？

我们使用 BuildHTTPClient 以编程方式创建构建定义的副本更新内存中的变量然后将更新的对象保存为新定义我在用着Microsoft TeamFoundation Build2 WebApi BuildHTTPClient h
在android中显示栏之间的空格

如何在android中提及条形图的条形之间的空格 Thanks in advance 上面的图片会让你清楚我的疑问即蓝色条实际上不适合相应的 x 轴值这里是 Ord 1 Ord 2 Ord 3 Ord 4 我需要显示这些带有 x 轴值
OpenCV 2.3 中的 VideoCapture 问题

我使用时遇到问题视频截取用于打开 MPEG 视频文件的类代码已正确编译但是在运行期间它无法打开文件并给出以下警告消息警告打开文件时出错 modules highgui src cap ffmpeg impl hpp 477 仅当
使用 JNI 从单独的线程调用静态 Java 方法

我正在尝试在 android 中使用 JNI 来创建一个函数指针我正在使用的本机库将其调用转发给 java When initializeStateController被调用使用创建一个新线程pthread create每当状态控制器的
使用 bash shell 脚本替换文件中的字符串

我想在文件中找到一个字符串进行一些操作并将该字符串放回文件中下面给出的是我需要的示例 cat sample txt TimeStamp gt 123456 Name gt ABC Mail gt email protected cdn
在makefile中写入依赖项，用makefile

基于一些SO问题以及发现的一些进一步的参考我正在尝试构建一个能够查找给定目录 SRC the cpp待编译的文件编译 cpp 生产 o物体产生 so每个共享对象 o以前编译的为了实现这一点 make 文件应该做的是查找给定
解决方案。有代理时如何install_github

当您尝试从 GitHub 存储库安装某些 R 包时 install github rWBclimate ropensci 如果您出现以下错误 Installing github repo s rWBclimate master from r
从 mysql 网站检索时未选择数据库

我有一个 mysql 数据库我正在尝试从我们的网站主机 godaddy 检索该数据库我遵循了一种似乎正确的格式但它告诉我 java sql SQLException No database selected Code public s
无缝循环音频 html5

有人知道如何实现音频标签的无缝循环吗我在想一些基于javascript的东西我有一个循环比如 1 小节我希望它循环并保持节奏所以我需要循环平滑无间隙当我简单地将循环设置为 true 时它会滞后并且不会保持节奏虽然仍然
在 JBoss Seam 上实现 SOAP Web 服务的最佳方法是什么？

我需要在 Jboss Seam 2 1 0 上实现 SOAP Web 服务这个想法是将无状态 bean 方法导出为 Web 服务然而我发现了两种方法第一个是使用 Seam 自己的 Web 服务注释这样做的问题是缺乏文档第二个是
C# ASP.NET MVC 控制器单元测试

我对单元测试有点陌生我想知道我这样做是否正确 Controller public ActionResult Index return View Message Index TestMethod public void MessageVie
在张量流中compute_gradients返回什么

mean sqr tf reduce mean tf pow y y 2 optimizer tf train AdamOptimizer LEARNING RATE gradients variables zip optimizer co

在张量流中compute_gradients返回什么

在张量流中compute_gradients返回什么 的相关文章

随机推荐

热门标签

在张量流中compute_gradients返回什么的相关文章