梯度下降有哪些替代方案？

2024-05-13

梯度下降存在局部极小值问题。我们需要运行梯度下降指数次来找到全局最小值。

谁能告诉我梯度下降的任何替代方案及其优缺点。

Thanks.

See 我的硕士论文 https://arxiv.org/pdf/1707.09725.pdf#page=96对于非常相似的列表：

神经网络的优化算法

Gradient based
- Flavours of gradient descent (only first order gradient):
  - Stochastic gradient descent:
  - Mini-Batch gradient descent:
  - Learning Rate Scheduling:
    - Momentum:
    - RProp https://en.wikipedia.org/wiki/Rprop和小批量版本 RMSProp
    - AdaGrad https://en.wikipedia.org/wiki/Stochastic_gradient_descent#AdaGrad
    - 阿达德尔塔 (paper http://arxiv.org/pdf/1212.5701v1.pdf)
    - 指数衰减学习率
    - 绩效调度
    - 新手调度
  - 快速推进 https://en.wikipedia.org/wiki/Quickprop
  - 内斯特罗夫加速梯度 (NAG)：解释 http://cs231n.github.io/neural-networks-3/#sgd
- Higher order gradients
  - 牛顿法 https://en.wikipedia.org/wiki/Newton%27s_method: 通常不可能 https://stats.stackexchange.com/a/253636/25741
  - Quasi-Newton method
    - BFGS
    - L-BFGS
- Unsure how it works
  - Adam (Adaptive Moment Estimation)
    - AdaMax
  - 共轭梯度
Alternatives
- 遗传算法
- 模拟退火
- Twiddle https://martin-thoma.com/twiddle/
- 马尔可夫随机场（graphcut/mincut）
- The 单纯形算法用于运筹学环境中的线性优化，但显然也用于神经网络（source https://visualstudiomagazine.com/articles/2014/10/01/simplex-optimization.aspx)

您可能还想看看我的文章优化基础知识 https://martin-thoma.com/optimization-basics以及 Alec Radfords 的精美动图：1 https://i.stack.imgur.com/iZOUf.jpg and 2 https://i.stack.imgur.com/D25Fj.jpg, e.g.

其他有趣的资源有：

梯度下降优化算法概述 http://sebastianruder.com/optimizing-gradient-descent/

权衡

我认为所有发布的优化算法都有一些具有优势的场景。一般权衡是：

您一步获得了多少进步？
你能多快计算一步？
该算法可以处理多少数据？
是否保证找到局部最小值？
优化算法对你的函数有什么要求？（例如一次、两次或三次可微）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

neuralnetwork

LogisticRegression

gradientdescent

梯度下降有哪些替代方案？的相关文章

R 中多类分类的 ROC 曲线

我有一个包含 6 个类别的数据集我想绘制多类别分类的 ROC 曲线 Achim Zeileis 给出的第一个答案非常好 R中使用rpart包的ROC曲线 https stackoverflow com questions 30818188
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
支持向量机或人工神经网络进行文本处理？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案对于某些文本处理项目我们需要在支持向量机和快速人工神经网络之间做出选择它包括上下文拼写纠正然后将文本标记为某些短语及其同义词哪种方
Encog - 如何加载神经网络的训练数据

The NeuralDataSet我在实际中看到的对象除了 XOR 之外什么都没有它只是两个小数据数组我无法从文档中找出任何内容MLDataSet 似乎所有内容都必须立即加载但是我想循环遍历训练数据直到到达 EOF 然后将其算作
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
梯度下降有哪些替代方案？

梯度下降存在局部极小值问题我们需要运行梯度下降指数次来找到全局最小值谁能告诉我梯度下降的任何替代方案及其优缺点 Thanks See 我的硕士论文 https arxiv org pdf 1707 09725 pdf page 96对于
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
在 Keras 中连接两个目录迭代器

假设我有类似以下内容 image data generator ImageDataGenerator rescale 1 255 train generator image data generator flow from director
如何在sklearn管道中通过特征消除选择特征名称？

我在 sklearn 管道中使用递归特征消除管道看起来像这样 from sklearn pipeline import FeatureUnion Pipeline from sklearn import feature selection
Python sklearn 多标签分类：用户警告：所有训练示例中都存在标签不是 226

我正在尝试多标签分类问题我的数据看起来像这样 DocID Content Tags 1 some text here 70 2 some text here 59 3 some text here 183 4 some text here
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx
从 scikit_learn 反转 MinMaxScaler

为了为我的生成神经网络提供数据我需要将一些数据标准化在 1 和 1 之间我用MinMaxScaler来自 Sklearn 效果很好现在我的生成器将输出 1 到 1 之间的数据如何恢复MinMaxScaler获得真实数据让我们首先
在keras自定义损失中使用层输出

我正在 Keras 中开发自定义损失函数我需要第一层输出我怎样才能取回它 def custom loss y true y pred cross K mean K binary crossentropy y true y pred ax

随机推荐

获取传单地图放大时的标记列表

我是传单新手我已按照以下步骤设置了地图https github com Asymmetrik ngx leaflet https github com Asymmetrik ngx leaflet 我正在尝试获取地图放大区域中的标记列表
自定义 OpenVPN iOS 客户端 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在开发一个自定义 iOS OpenVPN 客户端我找到了这个原生 OpenVPN 客户端核心源码https staging op
通过ajax POST提交两次表单

插入到mysql using php通过文件调用AJAX 前insert语句php代码执行select查询到查找重复记录并继续insert statement Issue 从ajax调用php文件时它执行了两次并得到作为重复记录的响应好
在 Chrome 扩展中创建隐藏的 iframe

是否可以在 google chrome 扩展中的 background html 页面上创建一个 iframe 并让它向网站发出请求我不确定该扩展程序到底是如何工作的 chrome 会自动忽略所有显示标签还是会以不可见的方式运行它它会正
使用经度和纬度查找给定距离内的所有附近客户

我有一个包含客户经度和纬度的数据库我有一个搜索表单用户将在其中输入日志纬度距离下拉列表包含 50 英里 100 英里当用户单击搜索时我想编写一个 linq 查询从数据库中获取此距离半径内的所有客户如何使用 C 和 linq 来
jQuery UI 选项卡 - 将选项卡绑定到同一页面上的链接

我正在尝试将选项卡绑定到同一页面上的链接但我是 jQuery 的新手需要一些帮助我的选项卡使用 jQuery UI 站点的代码但是如何绑定同一页面侧边栏中的链接呢
在 git 子模块中签出分支

如何从子模块内更改分支当我跑步时git branch从子模块内我看到以下输出 gt git branch HEAD detached from 229a7b2 master 我如何将自己置于一个新的分支上喜欢development 只
将命令行参数传递给 emscripten 生成的应用程序

当使用 Emscripten 编译 C 程序时会生成一个 HTML 页面来显示程序的结果我想知道如何将命令行参数传递给应用程序例如对于原始的 C 程序它是 bfs 32 1 我能够通过向生成的 html 文件添加一行来传递命令行参
平衡两轮机器人而不使其向前/向后漂移

我正在尝试设计一个控制器来平衡 2 轮机器人约 13 公斤并使其能够抵抗外力例如如果有人踢它它不应该掉落也不应该无限期地向前向后漂移我对大多数控制技术 LQR 滑模控制 PID 等都很有经验但我在网上看到大多数人使用 L
Mongoid 命名范围比较同一文档中的两个时间字段

我需要在 Mongoid 中创建一个命名范围来比较同一文档中的两个时间字段例如 scope foo where gt updated at gt gt checked at 这显然不会像它对待的那样起作用 checked at作为一个符号
MySQL：查询中周数的周日期范围

我有一个看起来像这样的数据库表 id clock info 1 1262556754 some info 2 1262556230 some other info 3 1262556988 and another 4 1262555678
Haskell - 用防护罩替换外壳

我想知道在这部分代码中是否可以用守卫替换 case 语句 firstFunction String gt Maybe MyType secondFunction MyType gt Integer myFunction String gt
保存和恢复陷阱状态？管理多个陷阱处理程序的简单方法？

有什么好的方法可以覆盖bash陷阱处理程序不会永久破坏可能已设置或尚未设置的现有处理程序动态管理任意陷阱例程链怎么样有没有办法保存陷阱处理程序的当前状态以便以后可以恢复在 Bash 中保存和恢复陷阱处理程序状态我将提交以下堆栈实现
Tweepy 流式传输错误

我正在尝试使用 tweepy 和 textblob 分析推文的情绪我执行了 pip install tweepy 并且安装成功但出现以下错误错误信息文件 C Users joshey Desktop sent py 第 2 行位于
Xamarin 无法从异步获取实例

我编写了一个通过蓝牙连接到 ESP32 的 Xamarin Forms 应用程序现在我想从 MainPage xaml 页面的 CustomControl JoystickControl 获取值我已经这样尝试过了 MainPage xa
如何使用 javascript 迭代文件系统目录和文件？

我正在使用 Javascript 编写一个应用程序该应用程序将与 Phonegap 一起使用来制作 Android 应用程序我正在使用 Phonegap File API 来读取目录和文件相关代码如下所示 document addEv
未定义条件编译符号

我无法让 Visual Studio 按照我的预期运行我创建了 2 个配置文件一个定义了符号 FOO 另一个定义了符号 BAR 我有这个代码 static class MyClass if FOO public static strin
http.put 请求在 Angular2 中执行两次

我正在尝试更新从我的 Angular2 应用程序调用 API 的公司记录我在调试时注意到 http 调用被执行了两次我找到了另一个堆栈溢出线程 https stackoverflow com questions 37241294 ang
SQL：将一个表中的所有记录插入到另一表中，而不指定列

我想将备份表 foo bk 中的所有记录插入到 foot 表中而不指定特定的列如果我尝试这个查询 INSERT INTO foo SELECT FROM foo bk 我会收到错误插入错误列名称或提供的值的数量与表定义不匹配是否可
梯度下降有哪些替代方案？

梯度下降存在局部极小值问题我们需要运行梯度下降指数次来找到全局最小值谁能告诉我梯度下降的任何替代方案及其优缺点 Thanks See 我的硕士论文 https arxiv org pdf 1707 09725 pdf page 96对于

梯度下降有哪些替代方案？

神经网络的优化算法

权衡

梯度下降有哪些替代方案？ 的相关文章

随机推荐

热门标签

梯度下降有哪些替代方案？的相关文章