如何在训练期间切换 tf.train.Optimizers？

2024-01-04

我想从Adam https://www.tensorflow.org/api_docs/python/tf/train/AdamOptimizer to SGD https://www.tensorflow.org/api_docs/python/tf/train/GradientDescentOptimizer经过一定数量的 epoch 后。如何顺利地完成此操作，以便将权重/梯度传递给新的优化器？

只需定义两个优化器并在它们之间切换：

sgd_optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
adap_optimizer = tf.train.AdamOptimizer(learning_rate).minimize(cost)
...
for epoch in range(100):
  for (x, y) in zip(train_X, train_Y):
    optimizer = sgd_optimizer if epoch > 50 else adap_optimizer
    sess.run(optimizer, feed_dict={X: x, Y: y})

优化器仅封装将梯度应用于张量的方式，并且可能仅保存一些自己的变量。模型权重不存储在优化器中，因此您可以轻松切换它们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

tensorflow

gradientdescent

如何在训练期间切换 tf.train.Optimizers？的相关文章

张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
mlflow 如何使用自定义转换器保存 sklearn 管道？

我正在尝试使用 mlflow 保存 sklearn 机器学习模型这是一个包含我定义的自定义转换器的管道并将其加载到另一个项目中我的自定义转换器继承自 BaseEstimator 和 TransformerMixin 假设我有 2 个项
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
没有带有张量板的图表

我正在读一本关于 Tensorflow 的书我发现了这段代码 from future import absolute import from future import division from future import print
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
张量流如何处理无法存储在一个盒子中的大变量

我想通过训练超过十亿特征维度的数据来训练 DNN 模型因此第一层权重矩阵的形状将为 1 000 000 000 512 这个权重矩阵太大无法存储在一个盒子中目前有没有什么解决方案来处理这么大的变量例如将大的权重矩阵划分为多个框 Up
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
Tensorflow中通过字符串选择不同的模式

我正在尝试构建一个 VAE 网络我希望模型在不同的模式下做不同的事情我有三种模式训练相同和不同以及一个名为 interpolation mode 的函数它根据模式执行不同的操作我的代码如下所示 import tensorf
如何重现 Ridge(normalize=True) 的行为？

这段代码 from sklearn pipeline import make pipeline from sklearn preprocessing import StandardScaler from sklearn linear mod
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另

随机推荐

如何在 iPhone 纵向视图中使 iframe 宽度为 100%

基本上我遇到了同样的问题here https stackoverflow com questions 13079564 appcelerator webview on iphone with an iframe and width 但因为他
CMake：如何从子项目的所有静态库创建单个共享库？

我有以下布局 top project subproject1 subproject2 Each of subproject1 and subproject2创建静态库我想将这些静态库链接到单个共享库中top project level 目
朱莉娅：无论是否面向对象编程

我正在和朱莉娅一起研究朱诺号我不知道 Julia 是否支持 OOP 例如有没有类似的东西class or struct of c 如何用数据或函数等成员来声明它如有疑问请阅读文档 https docs julialang org e
非单例sql连接的性能更好吗？

这是以下问题的后续问题是否需要解构单例sql连接 https stackoverflow com questions 32645209 is it necessary to deconstruct singleton sql connec
C++ 错误：无法将字段声明为抽象类型

情况是这样的 class Base virtual void methodA 0 virtual void methodB 0 class Base A public Base void methodA void methodB class
jQuery：除了一列之外，使整个表格行成为一个链接

我有一个脚本可以使每个表行可单击作为链接但是我需要最后一列保持不变因为该列作为编辑按钮谁能帮我修改脚本以便它可以工作吗到目前为止的 jQuery 是这样的 document ready function movies tr c
Ruby：迭代思考文件夹中的所有.rb（包括子文件夹）文件

文件结构 folderA folder1 file1 rb file2 rb folder2 folder1 file1 rb folder2 file1 rb file1 rb file2 rb 使用下面的代码我只能迭代folderA f
使用复选框的空指针异常

我正在尝试展示复选框状态通过展示Toast每当用户这样做时Click on button为此我正在使用 AlertDialog 但出现空指针异常完整的 Logcat 07 12 06 32 44 851 E AndroidRuntime
“data”和“type”关键字有什么区别？

The data and type关键词总是让我困惑我想知道有什么区别data and type以及如何使用它们 type声明一个类型同义词类型同义词是现有类型的新名称例如这是如何String被定义为在标准库中 http hacka
iOS：com.apple.root.default-overcommit-priority

我收到来自 Crashlytics 的崩溃消息 Crashed com apple root default overcommit priority EXC BAD ACCESS KERN INVALID ADDRESS at 0x8b2b
当我使用构建命令时，Docker compose 会忽略我的 Dockerfile

我有这个文件夹结构 home 我 composetest home me composetest mywildflyimage 在复合材料内部我有这个 docker compose yml web image test mywildfly
html 中 img 标签的 webp 后备

我知道解决方案是
使用python语言将像{1:23,2:45,3:17}这样的小字典插入Postgres中SQL数据库表的列中

我有一个表其中包含一个 varchar 类型列和 2 个 json 类型列我使用以下方法创建了该表 create table global records cattle id varchar 255 not null primary k
根据一个 SQL 表中的数据更新另一表中的数据

我正在运行 Microsoft SQL Server 2008 R2 并从两个表中提取信息来创建一个新表表 A 包含具有唯一导联编号和其他信息的导联表 B 包含具有唯一销售编号的销售额以及与其关联的销售线索编号两个表中的数据都被拉入
如何导入语义 ui 的小部分？

我想使用来自的特定模块semantic ui https semantic ui com modules sticky html https semantic ui com modules sticky html 假设我还主要使用其他框架
安装R包时出错

请帮助我我无法安装 MASS 包 gt library MASS Error in library MASS there is no package called MASS 我尝试从本地安装 MASS 包 gt utils menuIns
我如何在Prolog中实现“我是我自己的爷爷”？

以下故事摘自 N Wirth 的 1976 算法数据结构程序我娶了一个寡妇我们暂且称她为W吧谁有一个已经成年的女儿叫她 D 我的父亲 F 来拜访我们很多时候爱上了我的继女并娶了她因此我的父亲成了我的女婿我的继女成了
PHP 致命错误：找不到类“Memcached”

php v PHP 5 5 10 1 deb sury org precise 1 cli built Mar 27 2014 16 18 01 Copyright c 1997 2014 The PHP Group Zend Engine
HTML5 视频播放器阻止搜索

我正在创建一系列视频教程并希望防止用户向前查找和跳过部分我将使用将用于桌面和 iPad 浏览器的 HTML5 视频播放器理想情况下我希望它也能在 iPhone 上运行但我意识到你无法控制手机上的视频因为它使用 iPhone 视频
如何在训练期间切换 tf.train.Optimizers？

我想从Adam https www tensorflow org api docs python tf train AdamOptimizer to SGD https www tensorflow org api docs python

如何在训练期间切换 tf.train.Optimizers？

如何在训练期间切换 tf.train.Optimizers？ 的相关文章

随机推荐

热门标签

如何在训练期间切换 tf.train.Optimizers？的相关文章