Tensorflow：使用 Adam 优化器

2024-04-30

我正在张量流中试验一些简单的模型，包括一个看起来与第一个非常相似的模型面向 ML 初学者的 MNIST 示例 http://www.tensorflow.org/tutorials/mnist/beginners/index.md，但维数稍大一些。我能够毫无问题地使用梯度下降优化器，获得足够好的收敛性。当我尝试使用 ADAM 优化器时，出现如下错误：

tensorflow.python.framework.errors.FailedPreconditionError: Attempting to use uninitialized value Variable_21/Adam
     [[Node: Adam_2/update_Variable_21/ApplyAdam = ApplyAdam[T=DT_FLOAT, use_locking=false, _device="/job:localhost/replica:0/task:0/cpu:0"](Variable_21, Variable_21/Adam, Variable_21/Adam_1, beta1_power_2, beta2_power_2, Adam_2/learning_rate, Adam_2/beta1, Adam_2/beta2, Adam_2/epsilon, gradients_11/add_10_grad/tuple/control_dependency_1)]]

其中抱怨未初始化的特定变量根据运行而变化。这个错误是什么意思？它表明什么是错误的？无论我使用的学习率如何，它似乎都会发生。

AdamOptimizer 类创建称为“槽”的附加变量来保存“m”和“v”累加器的值。

如果您好奇，请参阅此处的源代码，它实际上非常可读：https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/training/adam.py#L39 https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/training/adam.py#L39。其他优化器，例如 Momentum 和 Adagrad 也使用槽。

在训练模型之前必须初始化这些变量。

初始化变量的正常方法是调用tf.initialize_all_variables()添加操作来初始化图中存在的变量当它被调用时.

（另外：与它的名字所暗示的不同，initialize_all_variables() 不会初始化任何东西，它只添加在运行时初始化变量的操作。）

你必须做的是调用initialize_all_variables()after您已经添加了优化器：

...build your model...
# Add the optimizer
train_op = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
# Add the ops to initialize variables.  These will include 
# the optimizer slots added by AdamOptimizer().
init_op = tf.initialize_all_variables()

# launch the graph in a session
sess = tf.Session()
# Actually intialize the variables
sess.run(init_op)
# now train your model
for ...:
  sess.run(train_op)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Tensorflow：使用 Adam 优化器的相关文章

如何在python 3.7中生成条形码

我正在使用 python 3 7 为了生成条形码我尝试使用安装 pyBarcode 库pip install pyBarcode 但它显示以下错误找不到满足 pyBarcode 要求的版本来自版本找不到 pyBarcode 的匹配分
Sublime Text 插件开发中的全局 Python 包

一总结我不知道 Sublime Text 插件开发人员如何使用 Sublime Text 查找全局 Python 包而不是 Sublime Text 目录的 Python 包 Sublime Text使用自己的Python环境而不是
使用 pygame 显示 unicode 符号

我检查了其他答案但不明白为什么我的代码错误地显示 This is what I currently see https i stack imgur com 8tNIK png 这是关于文本渲染的相关代码 font pygame font
为什么删除临时文件时出现WindowsError？

我创建了一个临时文件向创建的文件添加了一些数据已保存然后尝试将其删除但我越来越WindowsError 编辑后我已关闭该文件如何检查哪个其他进程正在访问该文件 C Documents and Settings Administra
Pandas：GroupBy 到 DataFrame

参考这个关于 groupby 到 dataframe 的非常流行的问题 https stackoverflow com questions 10373660 converting a pandas groupby object to dat
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
sklearn 中的 pca.inverse_transform

将我的数据拟合后 X 我的数据 pca PCA n components 1 pca fit X X pca pca fit transform X 现在 X pca 具有一维当我根据定义执行逆变换时它不是应该返回原始数据即 X 二维
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
一段时间后终止线程的最 Pythonic 方法

我想在线程中运行一个进程它正在迭代一个大型数据库表当线程运行时我只想让程序等待如果该线程花费的时间超过 30 秒我想终止该线程并执行其他操作通过终止线程我的意思是我希望它停止活动并优雅地释放资源我认为最好的方法是通过Thre
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
.pyx 文件出现未知文件类型错误

我正在尝试构建一个包含 pyx 文件的 Python 包 pyregion 但在构建过程中出现错误检查以下输出 python setup py build running build running build py creating b
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
使用 Keras np_utils.to_categorical 的问题

我正在尝试将整数的 one hot 向量数组制作为 keras 将能够使用的 one hot 向量数组来拟合我的模型这是代码的相关部分 Y train np hstack np asarray dataframe output vecto
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
在 Django 查询中使用 .extra(select={...}) 引入的值上使用 .aggregate() ？

我正在尝试计算玩家每周玩游戏的次数如下所示 player game objects extra select week WEEK games game date aggregate count Count week 但姜戈抱怨说 Fiel
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练

随机推荐

Rails，单击 link_to helper 后未加载 JavaScript

当我在 Rails 中使用 link to 帮助程序时我在加载 javascript 时遇到了一些问题当我手动输入 localhost 3000 products new 的 url 或重新加载页面时 JavaScript 会加载但是
在 iOS SDK 中与 Java RMI 服务器通信

有什么方法可以在 iPhone 上构建一个能够与 Java RMI 服务器通信的客户端吗我计划将该应用程序放在应用程序商店中因此很高兴知道苹果是否允许通过任何方式来执行此操作 None
从 JVM 线程本地空间卸载 Clojure 变量

我正在 Clojure 中为 BaseX 编写一个插件通过 lein uberjar 构建并包含 Clojure 解释器在大多数情况下这效果很好然而当通过 BaseX HTTP 实例运行时评估在 Jetty 的线程池内进行而
如何列出引用 SQL Server 中给定表的所有外键？

我需要删除 SQL Server 数据库中高度引用的表如何获取删除表时需要删除的所有外键约束的列表 SQL 答案比在 Management Studio 的 GUI 中单击有关更好不知道为什么没有人建议但我使用sp fkeys查询给定表
NSMutableArray 销毁

我有一个数组NSMutableArray与快乐的物体每当我尝试清除所有对象的数组并重新填充它时这些对象就会恶意地打开泄漏我它是在 init 函数中分配的如下所示 self list NSMutableArray array 我用
Chrome 浏览器自动向下滚动内容（当没有人要求时）

我们有丰富的页面其中有一个包含动态内容的小块直到最近一切都运转良好现在 Chrome 浏览器以某种方式捕获页面上的一个 div 并向下滚动整个内容用语言很难解释但演示起来却容易得多这是测试页只需在 Chrome 中打开它
基于登录状态 React Native 的动态 DrawerNavigator

我需要一个 DrawerNavigator 它在用户登录或注销时显示不同的选项如下所示未登录 sign up log in info 登录 My Account Some Actions Info Log Out
Python：从区间到值的映射

我正在重构一个函数给定一系列隐式定义间隔的端点检查间隔中是否包含数字然后返回相应的值不以任何可计算的方式相关现在处理这项工作的代码是 if p lt 100 return 0 elif p gt 100 and p lt 300
使 String.CharacterView.Index 符合 Strideable：使用 stride(to:by:) 时出现致命错误：“无法增加 endIndex ”

问题当试图跨过去时String CharacterView Index索引例如一步2 extension String CharacterView Index Strideable let str 01234 for in str st
无法安装 MvcMailer

我尝试通过在程序包管理器控制台中输入命令 Install Package MvcMailer 来安装 Mvc Mailer 但收到以下错误消息 Successfully installed MvcMailer 1 1 Successfull
拉维尔 |如何使用多个属性执行搜索

我正在创建属性网站并且正在使用多个属性进行搜索但问题是在搜索控制器中我有非常大的代码并且非常难以处理 laravel 中是否存在其他解决方案 list property Listing property where property t
Python：将字典转换为字节

我正在尝试将字典转换为字节但在将其转换为正确的格式时遇到问题首先我尝试使用自定义架构映射字典模式定义如下 class User def init self name None code None self name name sel
RESTful API 应该有架构吗？

最近有人告诉我一个合适的 RESTful API 应该为其接受和返回的资源表示定义一个模式例如用于 XML 的 XSD 和用于 JSON 的 JSON 架构然而在我读过的所有关于 REST 的书籍和文章中这一点似乎不仅没有突出
将 TPopupMenu 与窗体的右侧对齐？

TPopupMenu 如何与窗体的右侧对齐问题是在调用之前似乎没有办法获取弹出菜单的宽度Popup X Y Integer 我正在尝试获得与 Chrome 中的系统菜单类似的行为你也可以只设置Alignment http docwik
引导表上的滚动条

I have table渲染在一个panel这是在一个modal 由于表格相对较大我想将其行数限制为 5 行以便模式不会滚动我浏览了 SO 和谷歌到处都看到我需要设置overflow y auto or overflow y scr
linq按顺序插入元素的方法

我有一个按元素的 Name 属性排序的元素集合我需要在保持顺序的同时将新元素插入集合中我正在寻找一种简洁的 LINQ 方法来做到这一点我的代码如下 this Children 是集合 d 是我需要插入的新元素需要两次遍历集合才能找到
Datatables.net 与 ReactJS，在列中渲染 ReactJS 组件

我有以下带有数据表的组件 import React Component from react import Link from react router import PanelContainer Panel PanelBody Grid
隐式参数解析——设置优先级

我正在尝试创建一个类型类Default为给定类型提供默认值这是我到目前为止所想到的 trait Default A def value A object Default def withValue A a A new Default A
按应用于 Pandas 中同一列的条件进行计数

这是我的数据框 acc index veh count veh type 001 1 1 002 2 1 002 2 2 003 2 1 003 2 2 004 1 1 005 2 1 005 2 3 006 1 2 007 2 1 007
Tensorflow：使用 Adam 优化器

我正在张量流中试验一些简单的模型包括一个看起来与第一个非常相似的模型面向 ML 初学者的 MNIST 示例 http www tensorflow org tutorials mnist beginners index md 但维数稍大一

Tensorflow：使用 Adam 优化器

Tensorflow：使用 Adam 优化器 的相关文章

随机推荐

热门标签

Tensorflow：使用 Adam 优化器的相关文章