我们应该为 adam 优化器做学习率衰减吗

2024-02-13

我正在使用 Adam 优化器训练图像定位网络，有人建议我使用指数衰减。我不想尝试这个，因为 Adam 优化器本身会降低学习率。但那家伙坚持说他以前就这么做过。那么我应该这样做吗？你的建议背后有什么理论依据吗？

这取决于。 ADAM 使用单独的学习率更新任何参数。这意味着网络中的每个参数都有一个特定的相关学习率。

But每个参数的单个学习率是使用 lambda（初始学习率）作为上限计算的。这意味着每个学习率可以从 0（无更新）到 lambda（最大更新）变化。

确实，学习率在训练步骤中会自行调整，但如果您想确保每个更新步骤不超过 lambda，您可以使用指数衰减或其他方式降低 lambda。当使用先前关联的 lambda 参数计算出的损失停止减少时，它可以帮助减少训练的最新步骤中的损失。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neuralnetwork

tensorflow

我们应该为 adam 优化器做学习率衰减吗的相关文章

Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
OutOfRangeError（请参阅上面的回溯）：FIFOQueue '_1_batch/fifo_queue' 已关闭并且元素不足（请求 32，当前大小 0）

我在使用队列中张量流读取图像时遇到问题请让我知道我犯了什么错误下面是代码 import tensorflow as tf slim tf contrib slim from tensorflow python framework imp
keras 层教程和示例

我正在尝试编码和学习不同的神经网络模型我对输入维度有很多复杂性我正在寻找一些教程显示层的差异以及如何设置每个层的输入和输出 Keras 文档 https keras io layers core 向您展示所有input shape每层
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
没有带有张量板的图表

我正在读一本关于 Tensorflow 的书我发现了这段代码 from future import absolute import from future import division from future import print
在 keras 中集成采样的 softmax 失败

基于如何在 Keras 模型中使用 TensorFlow 的采样 softmax 损失函数 https stackoverflow com questions 47892380 how can i use tensorflows sampl
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
异常：加载数据时 URL 获取失败

我正在尝试设置我的机器来运行 Tensorflow 2 我从未使用过 Tensorflow 只是下载了 Python 3 7 我不确定这是否是我的机器的问题我按照上面列出的安装说明进行操作TensorFlow 的网站 https www
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back
Keras model.predict 函数给出输入形状错误

我已经在 Tensorflow 中实现了通用句子编码器现在我正在尝试预测句子的类概率我也将字符串转换为数组 Code if model model type universal classifier basic class probs

随机推荐

Google Cloud Platform - 云函数 API - 401 未经授权

我正在努力使用 Java 通过 REST API 调用 GCP 云功能我为此执行的步骤是创建角色为 Cloud Functions Invoker 的服务帐户下载新创建的服务帐户的 JSON 密钥文件在我的代码中使用以下方法获取访
事件查看器 — 记录到子文件夹？

我找啊找啊找不到答案我们有一个运行并登录到事件查看器的自定义服务在 Windows 7 中有一个名为应用程序和服务日志的文件夹我如何在那里记录事件有可能吗当您使用以下内容创建新的事件日志时它会自动发生 EventLog
如何使用 RestTemplate 从服务器接收应用程序/pdf 响应

我正在尝试捕获我的 java 客户端代码发出的 HTTP 请求的响应响应的内容类型为application pdf 在日志中我可以看到服务器发送了响应 Object result getRestTemplate postForObject
应用程序在制定新意图时崩溃。没有发现类定义错误

我试图通过单击按钮导航到fragmentactivity 但我的应用程序在创建意图的行崩溃谁能帮我弄清楚为什么我正在导航的活动也在同一个包中我相信它已正确记录在清单中这是我的清单
如何使用球衣发送和接收包含 JSON 的 PUT 请求？

这是我的服务器 PUT Path put Consumes MediaType APPLICATION JSON Produces MediaType TEXT PLAIN public Response insertMessage Mes
当 .h 文件明显可用时，为什么 autoconf 没有通过 AC_CHECK_HEADER 测试？

我花了很长时间让 autoconf 检查特定头文件是否存在我们将标头依赖项称为 inky h 并假设 inky 是一个单独安装的库前缀设置为 usr local 这会将 inky h 放入 usr local inky inky h
安装了rails_admin，一切都停止工作

所以我想创建一个应用程序人们可以在其中观看艺术问题是只有管理员才能创建编辑和删除数据所以我想添加一个管理界面我选择了rails admin gem 我已经按照 git 文档中的说明安装了所有内容但是当我安装它时所有内容都停止
通过 Mongoose 使用 req.body 更新和/或添加数组元素属性？

我有以下文件 id ObjectId 503b83dfad79cc8d26000004 pdfs title Test document pdf id ObjectId 504f6793ce351a595d000004 created at
禁用特定 pytest 标记上的自动使用装置

是否可以阻止执行功能范围的装置autouse True仅在特定标记上我将以下固定装置设置为自动使用以便自动模拟所有传出请求 pytest fixture autouse True def no requests monkeypatc
监听嵌套面板中的击键

在下面的 Java 文件中我创建了一个包含面板的框架然后该面板嵌套了第二个面板我正在尝试监听嵌套面板中的击键我的方法是使用输入映射和动作映射我发现如果我只有嵌套面板的输入映射事情就会按预期工作但是如果父面板也有输入映射则击
如何在 C# 中通过循环组成变量名称？

我重写了这个问题因为不是每个人都明白希望没问题这是同样的主要问题非常抱歉我有一个带有 15 个进度条的 winform 名为 baraClasa1 baraClasa2 baraClasa3 baraClasa15 我必须分配 V
创建内存中的 FileDescriptor

文件描述符 https developer android com reference java io FileDescriptor htmlAndroid 中的 API 说文件描述符类的实例用作不透明句柄代表打开文件的底层机器特定结构
两个不同的应用程序可以有相同的packageName吗？

我有这个代码来获取系统上所有应用程序的列表 PackageManager pm getPackageManager Intent mainIntent new Intent Intent ACTION MAIN List
swift + OS X 沙箱：将“NSVBOpenPanel”视为“NSOpenPanel”:: 因为我需要在委托方法中获取发送者

我使用 swift 并展示了一个 NSOpenPanel 在委托中我需要查看发送者的提示来区分要采取的操作 e g func show panel delegate self panel prompt xy panel run func
无法使用连接编译 C# linq 查询

下面是一些我在执行一些 linq 连接时无法编译的 C 代码的简化示例有谁知道为什么这不能编译错误是无法从查询中推断出类型参数在我的真实代码中Fetch 返回一个IQueryable
CSS Border 在一行中声明 4 个边、颜色、宽度

我这里有这样的规则 border 3px 0 0 0 solid ccc 然而边界的 4 条边似乎没有注册 border 3px solid ccc 不过似乎工作正常有没有一种方法可以制作一个分配了 4 个边宽的单行线虽然边框没有确切
使用 pandas.to_datetime 时仅保留日期部分

I use pandas to datetime解析我的数据中的日期 Pandas 默认表示日期datetime64 ns 即使日期都是每天的我想知道是否有一种优雅聪明的方法将日期转换为datetime date or datetime
使用 JDBC 将 CSV 复制到具有自定义类型数组的 Postgres

我在数据库中定义了一个自定义类型 CREATE TYPE address AS ip inet port int 以及在数组中使用此类型的表 CREATE TABLE my table addresses address NULL 我有一个
Android DownloadManager 类：getUriForDownloadedFile 返回错误路径

我使用 DownloadManager 库下载 apk 文件并且我有一个用于下载服务的 BroadcastReceiver 这是我在 onRecieve 中的代码 long id intent getExtras getLong Down
我们应该为 adam 优化器做学习率衰减吗

我正在使用 Adam 优化器训练图像定位网络有人建议我使用指数衰减我不想尝试这个因为 Adam 优化器本身会降低学习率但那家伙坚持说他以前就这么做过那么我应该这样做吗你的建议背后有什么理论依据吗这取决于 ADAM 使用单独的学

我们应该为 adam 优化器做学习率衰减吗

我们应该为 adam 优化器做学习率衰减吗 的相关文章

随机推荐

热门标签

我们应该为 adam 优化器做学习率衰减吗的相关文章