“冻结”张量流中的一些变量/范围：stop_gradient 与传递变量以最小化

2024-03-02

我正在尝试实施对抗性神经网络 http://arxiv.org/abs/1406.2661，这需要在交替训练小批量期间“冻结”图的一个或另一部分。 IE。有两个子网：G 和 D。

G( Z ) ->  Xz
D( X ) ->  Y

其中损失函数G依赖于取决于D[G(Z)], D[X].

首先，我需要在固定所有 G 参数的情况下训练 D 中的参数，然后在固定 D 中的参数的情况下训练 G 中的参数。第一种情况下的损失函数在第二种情况下将是负损失函数，并且更新必须应用于第一子网还是第二子网的参数。

我看到张量流有tf.stop_gradient功能。为了训练 D（下游）子网络，我可以使用此函数来阻止梯度流

 Z -> [ G ] -> tf.stop_gradient(Xz) -> [ D ] -> Y

The tf.stop_gradient注释非常简洁，没有内联示例（并且示例seq2seq.py太长而且不太容易阅读），但看起来必须在图形创建过程中调用它。这是否意味着如果我想以交替批次阻止/解除阻止梯度流，我需要重新创建并重新初始化图模型？

似乎还有无法通过以下方式阻止梯度流经 G（上游）网络：tf.stop_gradient, right?

作为一种替代方案，我看到可以将变量列表传递给优化器调用，如下所示opt_op = opt.minimize(cost, <list of variables>)，如果可以获取每个子网范围内的所有变量，这将是一个简单的解决方案。一个人可以得到一个<list of variables>对于 tf.scope？

正如您在问题中提到的，实现此目的的最简单方法是使用单独的调用创建两个优化器操作opt.minimize(cost, ...)。默认情况下，优化器将使用中的所有变量tf.trainable_variables() https://www.tensorflow.org/versions/master/api_docs/python/state_ops.html#trainable_variables。如果你想将变量过滤到特定的范围，你可以使用可选的scope论证tf.get_collection() https://www.tensorflow.org/versions/master/api_docs/python/framework.html#get_collection如下：

optimizer = tf.train.AdagradOptimzer(0.01)

first_train_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES,
                                     "scope/prefix/for/first/vars")
first_train_op = optimizer.minimize(cost, var_list=first_train_vars)

second_train_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES,
                                      "scope/prefix/for/second/vars")                     
second_train_op = optimizer.minimize(cost, var_list=second_train_vars)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

“冻结”张量流中的一些变量/范围：stop_gradient 与传递变量以最小化的相关文章

如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
将 numpy 数组合并为单个 int

numpy 数组怎么可以这样 10 22 37 45 转换为单个 int32 数字如下所示 10223745 这可以工作 gt gt gt int join map str 10 22 37 45 10223745 基本上你使用map s
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
如何使用scrapy检查网站是否支持http、htts和www前缀

我正在使用 scrapy 来检查某些网站是否工作正常当我使用http example com https example com or http www example com 当我创建 scrapy 请求时它工作正常例如在我的pa
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发

随机推荐

如何使用 javascript 替换字符串中所有出现的变量？

我正在尝试使用 javascript 替换字符串中所有出现的变量这不起作用 var id 1 var re new RegExp id g var newHtml oldHtml replace re 2 这仅替换第一次出现的 id va
按随机顺序对数组列表进行排序

我正在编写一个纸牌游戏我有一个ArrayList持卡 Object 在哪里他们每个人都有自己的 id 由于我想让这个游戏支持多人模式我必须以某种方式在两个玩家之间发送接收游戏进度现在如果我在一侧洗牌我必须在另一侧做同样的事情
使用 Nginx 设置 Laravel

我正在尝试设置Laravel http laravel com 可使用的 PHP 框架Nginx http wiki nginx org Main 这是我的目录结构 project application laravel public in
获取 Azure AD B2C 策略的 SAML 元数据时出错 - AADB2C90022

在 Azure AD B2C 中设置自定义策略以连接到 ADFS 身份提供程序这需要一个 SAML 元数据端点如下面链接的文档中所指定 https learn microsoft com en us azure active direc
为什么 XHTML 中的
与

不同？

这是 HTML 页面的完整源代码 one br two br three br four 谁能解释为什么当我在 IE8 或 chrome 中查看页面时三和四之间会出现额外的空行我认为标准应该让所有浏览器看起来都一样据我所知这个
自动将 CSV 文件导入 SQL Server [重复]

这个问题在这里已经有答案了我正在尝试将许多不同的 csv 文件导入 SQL Server 2008R2 数据库文件中的数据以逗号分隔我对文件格式没有发言权有些列是文本并用双引号分隔就像在 Excel 中一样这些列包含的文本可能
在View的背景中画一个半圆

我正在尝试创建一个背景为半圆的 TextView 我使用 ShapeDrawable 创建一个椭圆形我尝试使用 ScaleDrawable 将椭圆形的垂直尺寸加倍并剪辑它来创建半圆但是 ScaleDrawable 没有任何效果为什么不
我可以使用新的 ZeroClipboard 从剪贴板获取数据吗？

我在项目中使用这个新版本的 ZeroClipboard https github com jonrohan ZeroClipboard https github com jonrohan ZeroClipboard 创建按钮来从 HTML
python中的加权非负最小二乘线性回归[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我知道有一个加权 OLS 求解器 http statsmodels sourceforge net d
是否可以自定义 Visual Studio 2017 SSRS rptproj MSBuild 文件？

我的公司对自定义 MSBuild 目标文件库进行了大量投资我们用它来构建完整的产品我们在源代码管理中拥有的每个项目文件都会导入至少一个自定义目标文件这些文件最终都会导入一个包含大量通用目标和属性的核心目标文件最近我们在我们的解决方
给定输入生成真值表？

是否有一种智能算法可以获取多个概率并在多维数组或容器内生成相应的真值表 Ex n 3 N 0 0 0 0 0 1 0 1 0 1 1 1 我可以使用 for 循环和 If 来完成此操作但我知道我的方法会很慢且耗时因此我想问是否有一种高
Bootstrap 3 - 更改下拉菜单背景颜色

我对 Bootstrap 很陌生我设置了一个下拉菜单并尝试了颜色我想做的是在选择下拉标题药丸后更改其颜色它目前变为浅灰色这是我的代码 div class row hidden xs div class col md 12 ul cl
无法在 Selenium (Python) 中定位元素

我尝试在 Chrome 中使用 Selenium 但无法在页面上找到元素我尝试使用链接文本 XPath 和完整 XPath 但只有一个错误并且没有单击该元素 from selenium import webdriver from sel
Python：使用递归算法作为生成器

最近我编写了一个函数来生成具有重要约束的某些序列这个问题是通过自然递归解决方案来解决的现在即使对于相对较小的输入序列也有数千个因此我更愿意使用我的算法作为生成器而不是使用它来填充所有序列的列表这是一个例子假设我们想用递归函
如何将字母表中的 3 个字母前移（凯撒密码）？

我正在尝试制作一个程序来加密用户提交的字符串我想使用一种加密技术其中字符串是字母表中的前 3 个字母例子 abc会成为def 目前我有一个文本框 TextBox1 和一个按钮 Button1 到目前为止我的代码 Private Sub
在Eclipse中通过项目搜索

如何在Eclipse中通过项目搜索某个单词当我启动 CTRL h 时我需要选择字段方法或但我需要查找项目中所有出现的情况而不是方法字段或如何实现这一目标 CTRL H gt File Search gt Containing
如何将文件添加到应用程序沙箱中的 /Documents 目录

这是我所在的地方 I have JSON files I need to mount into Objective C Objects I have an XCode Project I have dragged the folder of
Javascript 无法解析相对于当前脚本的工作路径

我有一个脚本在http localhost js foo js需要从文件中生成一个 Web Workerhttp localhost js fooWorker js 我以为我可以做这样的事情 var worker new Worker fo
文本区域编辑器 Redactor。使用 jQuery 插入值

有字段文本区域id tr 使用 HTML 编辑器 Redactor 最新版本尝试按照 API 文档中的描述准确设置字段的值 tr redactor insertText text or tr redactor insertHtml tex
“冻结”张量流中的一些变量/范围：stop_gradient 与传递变量以最小化

我正在尝试实施对抗性神经网络 http arxiv org abs 1406 2661 这需要在交替训练小批量期间冻结图的一个或另一部分 IE 有两个子网 G 和 D G Z gt Xz D X gt Y 其中损失函数G依赖于取决于D

“冻结”张量流中的一些变量/范围：stop_gradient 与传递变量以最小化

“冻结”张量流中的一些变量/范围：stop_gradient 与传递变量以最小化 的相关文章

随机推荐

热门标签

“冻结”张量流中的一些变量/范围：stop_gradient 与传递变量以最小化的相关文章