张量流中的 tf.GraphKeys.TRAINABLE_VARIABLES 和 tf.GraphKeys.UPDATE_OPS 有什么区别？

2024-01-01

Here is doc https://www.tensorflow.org/api_docs/python/tf/GraphKeys张量流中的tf.GraphKeys，例如TRAINABLE_VARIABLES：将由优化器训练的变量对象的子集。

而且我知道tf.get_collection()，它可以找到你想要的一些张量。

使用时tensorflow.contrib.layers.batch_norm()，参数updates_collections默认值为GraphKeys.UPDATE_OPS.

我们如何理解这些集合以及它们之间的差异。

此外，我们可以在 ops.py 中找到更多信息。

这是两件不同的事情。

可训练变量

TRAINABLE_VARIABLES是的集合变量或在最小化损失时应修改的训练参数。例如，这些可以是确定网络中每个节点执行的功能的权重。

如何将变量添加到该集合中？当您使用以下命令定义新变量时，这种情况会自动发生tf.get_variable，除非您指定

tf.get_variable(..., trainable=False)

您什么时候希望变量无法训练？这种情况时有发生。例如，有时您会想要使用两步方法，首先在大型通用数据集上训练整个网络，然后在与您的问题特别相关的较小数据集上微调网络。在这种情况下，您可能只想微调网络的一部分，例如最后一层。将某些变量指定为不可训练是实现此目的的方法之一。

更新操作

UPDATE_OPS是一个集合ops（图运行时执行的操作，如乘法、ReLU 等），而不是变量。具体来说，该集合维护一个需要在每个训练步骤之前运行的操作列表。

如何将操作添加到此集合中？根据定义，update_ops 发生在损失最小化的常规训练流程之外，因此通常只有在特殊情况下才会将操作添加到此集合中。例如，在执行批量归一化时，您希望在每个训练步骤之前重新计算批量均值和方差，这就是它的完成方式。使用批量归一化的机制tf.contrib.layers.batch_norm中有更详细的描述本文 http://ruishu.io/2016/12/27/batchnorm/.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

张量流中的 tf.GraphKeys.TRAINABLE_VARIABLES 和 tf.GraphKeys.UPDATE_OPS 有什么区别？的相关文章

Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
合并张量流数据集批次

请考虑下面的代码 import tensorflow as tf import numpy as np simple features np array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 simple labels
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
TensorFlow HVX 加速支持

我成功构建并运行了测试应用程序https github com tensorflow tensorflow tree master tensorflow contrib hvx https github com tensorflow ten
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP？

老实说我想弄清楚如何转换数据集格式 pandasDataFrame或 numpy 数组转换为简单文本分类张量流模型可以训练用于情感分析的形式我使用的数据集类似于 IMDB 包含文本和标签正面或负面我看过的每个教程要么以不同的方式
如何在 Tensorflow 对象检测 API 中查找边界框坐标

我正在使用 Tensorflow 对象检测 API 代码我训练了我的模型并获得了很高的检测百分比我一直在尝试获取边界框坐标但它不断打印出 100 个奇怪数组的列表经过在线广泛搜索后我发现数组中的数字意味着什么边界框坐标相对于底层
类型错误：需要二进制或 unicode 字符串，得到 618.0

I ve been trying to implement this ML Linear Model into my dataset https www tensorflow org tutorials estimator linear L
Tensorflow：如何通过 tf.gather 传播梯度？

我在尝试传播损失函数相对于代表收集索引的变量的梯度时遇到一些问题类似于空间变换器网络中所做的事情 https github com tensorflow models blob master transformer spatial tra
在 Tensorflow 中使用迁移学习是否需要预定义图像大小？

我打算使用预先训练的模型例如fast rcnn resnet101 pets用于 Tensorflow 环境中的对象检测如所述here https tensorflow object detection api tutorial rea
PyInstaller 是否包含 CUDA

我正在开发一个Python脚本我使用Python 3 7 3 它使用tensorflow gpu 1 14 0 并使用PyInstaller 3 5将此脚本转换为可执行文件我使用的是 CUDA 10 0 和 cuDNN 7 6 1 我的
在优化器期间保持变量不变

我有一个损失张量 L 的 TensorFlow 计算图它取决于 2 个 tf Variables A 和 B 我想在保持 B 固定的同时在变量 A 上运行梯度上升 A L 与 A 的梯度反之亦然在 B 上运行梯度上升 B L 与 B
卷积神经网络 (CNN) 输入形状

我是 CNN 的新手我有一个关于 CNN 的问题我对 CNN 特别是 Keras 的输入形状有点困惑我的数据是不同时隙的二维数据比方说10X10 因此我有 3D 数据我将把这些数据输入到我的模型中来预测即将到来的时间段所以我
在 Datalab 中使用 Python3，我无法将代表 Google Cloud Storage 存储桶中的文件的字符串列表作为带有张量流的 feed_dict 提供

我是 tf 新手在尝试处理某些文件时遇到问题这是代码摘录 xlabel to files list map dog bark subset of data with two files result gs some bucket som
如何在arm64主机上运行amd64 docker镜像

警告请求的映像平台 linux amd64 与检测到的主机平台 linux arm64 v8 不匹配并且未请求特定平台 2021 07 28 22 25 06 349222 F tensorflow core platform cpu
Tensorflow 数据集的数据预处理是针对整个数据集还是针对每次调用 iterator.next() 进行一次？

您好我现在正在研究tensorflow中的数据集API 我有一个关于执行数据预处理的dataset map 函数的问题 file name image1 jpg image2 jpg im dataset tf data Dataset
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t

随机推荐

SQL 在 Select 语句中合并两列

如果我的数据库中有一个列是 Address1 和 Address2 我如何组合这些列以便我只能在 select 语句中对其执行操作我仍然会将它们单独保留在数据库中我希望能够做到这一点 WHERE completeaddress LIK
Dos 内联 IF 测试错误级别，不使用延迟扩展

无论如何是否可以在不延迟扩展的情况下执行以下操作一行为了可读性而中断 comspec v on c windir System32 reg exe import c temp test reg if errorlevel neq 0
为什么SELECT标签的下拉框显示在错误的位置？

My CSS file doesn t touch the tag select at all also no CSS classes are related to the tag select But when showing in br
C# 相当于 VB6 字符占位符

C 是否有相当于 VB6 格式函数中使用的符号 VB6 字符占位符显示一个字符或一个空格如果该字符串在格式字符串中出现的位置有字符则显示它否则在该位置显示一个空格占位符从右到左填充除非有格式字符串中的字符我猜你的意思是
抛出异常：WebDriver.dll 中的“OpenQA.Selenium.WebDriverException”

我是使用 C 的 Selenium 新手每当我尝试运行简单的代码时我都会得到 Exception thrown OpenQA Selenium WebDriverException in WebDriver dll 每次注意我使用的
如何在Python中跳出双while循环？

新手蟒蛇在这里如果用户选择 Q 作为退出我如何才能跳出第二个 while 循环如果我按 m 它会进入主菜单在那里我可以停止按 Q 键 while loop 1 choice main menu if choice 1 os sys
utf-8字符编码问题

我通过使用美丽的汤库从网页获得链接a get href 链接中有一个奇怪的字符但当我得到它时它变成了我怎样才能正确地对其进行编码我已经在页面开头添加了 coding utf 8 r requests get url soup Bea
ASP.NET 应用程序中的文件锁定（读/写）

我有两个 ASP NET Web 应用程序一个负责处理一些信息并写入日志文件另一个应用程序负责读取日志文件并根据用户请求显示信息这是我为作家编写的代码 public static void WriteLog String PathTo
Linux/POSIX 相当于 Win32 的 CreateEvent、SetEvent、WaitForSingleObject

我编写了一个小类用于同步 Linux 实际上是 Android 和 Windows 的线程这是我的界面的 Win32 实现 class SyncObjectWin32 public SyncObject private const HA
Windows XP 与 Vista：NTFS 连接点

Problem 我严重依赖 Windows XP 中的 NTFS 连接点尽管它们显然不是操作系统的官方功能现在 MSFT 慷慨地将 NTFS Junction 点作为 Vista 的官方部分但显然他们也是有意为之broke他们现
无法识别的导入路径（导入路径不以主机名开头）

我已经按照自定义安装条款安装了 go安装说明 https golang org doc install download go1 9 2 linux amd64 tar gz 因为我已安装到用户目录以便适应多个版本的 go When I
如何：使用 django/python 模板创建 .doc 文件

我正在编写一个 Django 应用程序但有些事情我不知道该怎么做假设您有一个包含用户的数据库以及您可能想要发送给这些用户的几个 doc 文件邮寄信件而不是电子方式我想知道是否有一种方法可以使用我的用户数据库自动从模板创建这些字母来
iOS Webkit 无法在设备上运行，但可以在 swift 模拟器上运行

我在程序中使用 htm 文件进行一些工作在模拟器中我定义了这样的本地文件 var a dic acil adi asString var path NSBundle mainBundle pathForResource a ofType
简单的Java独立服务器容器/框架？

在过去的几年里我一直专注于 Python 其中有许多简单最小的框架可供选择使我能够轻松建立网站或服务例如 web py 我正在寻找 Java 中类似的东西如今使用 Java 建立简单服务的最简单最少移动部件的方法是什么我正在
如何在.NET Core项目中获取类库程序集引用？

我有一个 ASP NET Core 项目 netcoreapp2 0 它引用类库项目 netstandard2 0 中的模型我正在尝试使用 Mapster 来映射存储在类库中的对象 Mapster 的文档说使用以下代码从 Startup
php 与curl ssl 错误：不支持的协议

当我运行 php 测试脚本尝试使用curl 和我的 Macports php 安装通过 https 连接到 Rackspace API 时我得到一个unsupported protocol错误 curl verbose 设置为 true
带有 Twisted 的异步 WSGI

我正在为扭曲的应用程序构建一个 Web 界面并且希望直接使用 WSGI 而不是 twins web 因为网站的其余部分是 WSGI 并且我已经拥有大量的 WSGI 代码库我发现关于 WSGIResource 的 Twisted 文档页面
如何将 matplotlib 中的线偏移 X 点

我正在使用 matplotlib 绘制一些我希望用箭头距离标记注释的数据这些箭头应偏移几个点以免与绘制的数据重叠 import matplotlib pyplot as plt import matplotlib transform
检查.getfile() 与检查.getsourcefile()

我刚刚浏览了检查模块文档两者之间到底有什么区别 inspect getfile and inspect getsourcefile 我得到了两者完全相同的模块的文件路径获取文件 http docs python org librar
张量流中的 tf.GraphKeys.TRAINABLE_VARIABLES 和 tf.GraphKeys.UPDATE_OPS 有什么区别？

Here is doc https www tensorflow org api docs python tf GraphKeys张量流中的tf GraphKeys 例如TRAINABLE VARIABLES 将由优化器训练的变量对象的子集

热门标签