梯度下降与随机梯度下降算法

2023-12-31

我尝试在 MNIST 手写数字数据集（包括 60K 训练样本）上训练前馈神经网络。

我每次都迭代所有训练样本，表演反向传播对于每个时期的每个这样的样本。运行时间当然太长了。

我运行的算法是否命名为梯度下降?

我读到对于大型数据集，使用随机梯度下降可以显着提高运行时间。

我应该做什么才能使用随机梯度下降？我应该随机挑选训练样本，执行反向传播在每个随机选取的样本上，而不是我当前使用的纪元上？

我会尝试给你一些关于这个问题的直觉......

最初，更新是在您（正确）调用的内容中进行的（批量）梯度下降。这确保了权重的每次更新都是在“正确”的方向上完成的（图 1）。1 https://i.stack.imgur.com/dHlJE.png)：最小化成本函数的函数。

随着数据集大小的增长以及每一步计算的复杂化，随机梯度下降在这些情况下成为首选。在这里，权重的更新是在处理每个样本时完成的，因此，后续计算已经使用“改进的”权重。尽管如此，正是这个原因导致它在最小化误差函数时出现了一些误导（图 1）。2 https://i.stack.imgur.com/yBk3p.png).

因此，在许多情况下，最好使用小批量梯度下降，结合了两全其美：权重的每次更新都是使用一小批数据完成的。这样，与随机更新相比，更新的方向在某种程度上得到了纠正，但更新的频率比（原始）的情况要频繁得多梯度下降.

[UPDATE]根据要求，我在下面提供了伪代码batch二元分类中的梯度下降：

error = 0

for sample in data:
    prediction = neural_network.predict(sample)
    sample_error = evaluate_error(prediction, sample["label"]) # may be as simple as 
                                                # module(prediction - sample["label"])
    error += sample_error

neural_network.backpropagate_and_update(error)

（在多类标签的情况下，错误表示每个标签的错误数组。）

该代码将运行给定的迭代次数，或者当误差高于阈值时。对于随机梯度下降，调用神经网络.backpropagate_and_update()被称为内部for循环，以样本误差作为参数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

梯度下降与随机梯度下降算法的相关文章

Microsoft 认知服务 - 计算机视觉：订阅密钥无效

我正在尝试使用计算机视觉API https azure microsoft com en us services cognitive services computer vision 来自微软的认知服务但是我的钥匙似乎不起作用我使用该
查找彼此接近的对象边界

我正在研究一个计算机视觉问题其中问题的第一步是找到物体彼此靠近的位置例如在下图中我感兴趣的是找到灰色标记的区域 Input Output 我目前的方法是首先反转图像然后通过侵蚀进行形态梯度跟随然后删除一些不感兴趣的轮廓脚本如下
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
如何在 Caffe 的网络中出现多次损失？

如果我在网络中定义多个损失层从这些末端到网络的开头是否会发生多个反向传播我的意思是他们真的是这样工作的吗假设我有这样的事情 Layer1 Layer2 Layer n Layer cls1 bottom layer n top cl
随机森林修剪

我有 sklearn 随机森林回归器它非常重有 1 6 GB 并且在预测值时工作很长时间我想把它修剪一下让它变得更轻据我所知决策树和森林没有实施修剪我无法自己实现它因为树代码是用 C 编写的而我不知道有谁知道解决方案吗
scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小根据 scikit learn 的文档随机森林是一种适合许多决策的元估计器数据集的各个子样本上的树分类器并使用平均以提高预测准确性并控制过度拟合子样本大小始终与原始输入样本相同大小但如
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
用于神经网络模型预测的数据的缺失值

我目前有大量数据将用于训练预测神经网络美国主要机场的千兆字节天气数据我几乎每天都有数据但有些机场的数据中存在缺失值例如机场在 1995 年之前可能不存在因此在此之前我没有该特定位置的数据此外有些还缺少整年可能跨度为 199
如何反转 dropout 来补偿 dropout 的影响并保持期望值不变？

我正在学习神经网络中的正则化deeplearning ai课程在dropout正则化中教授说如果应用dropout 计算出的激活值将比不应用dropout时测试时更小因此我们需要扩展激活以使测试阶段更简单我理解这个事实但我
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
将索引数组转换为 NumPy 中的 one-hot 编码数组

给定一个一维索引数组 a array 1 0 3 我想将其一次性编码为二维数组 b array 0 1 0 0 1 0 0 0 0 0 0 1 创建归零数组b有足够的列即a max 1 然后对于每一行i 设置a i 第列至1 gt
选择 c 和 gamma 值

您好我正在使用 SMO 执行 SVM 分类其中我的内核是 RBF 现在我想选择c and sigma值使用网格搜索和交叉验证我是内核函数的新手请帮助一步一步的过程选择一些您认为有趣的 C 和 sigma 值例如 C 1 10
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
神经网络中的时间序列提前预测（N点提前预测）大规模迭代训练

N 90 使用神经网络进行提前预测我试图预测提前 3 分钟即提前 180 点因为我将时间序列数据压缩为每 2 个点的平均值为 1 所以我必须预测 N 90 超前预测我的时间序列数据以秒为单位给出值在 30 90 之间它们通常从
如何确定与视频中物体的距离？

我有一个从行驶中的车辆前面录制的视频文件我将使用 OpenCV 进行对象检测和识别但我停留在一方面如何确定距已识别物体的距离我可以知道我当前的速度和现实世界的 GPS 位置但仅此而已我无法对我正在跟踪的对象做出任何假设我计划用
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特

随机推荐

TransitionFromView 删除之前的视图

我在应用程序中的视图之间转换时使用 TransitionfromView 时遇到问题 Setup 这是视图控制器的基本设置它有两个视图一个 MKMapView 和一个 UITableView 当按下切换按钮时应该在地图和表格之间交替视
使用 Bundler 安装 Gems == 大问题

如果我跑bundle install 一切都会过去我重新启动 nginx 当我访问该网站时我看到乘客错误如下 git github com spree spree git at master is not checked out Ple
使用 JavaScript 在特定延迟后执行脚本

有没有类似 jQuery 的 JavaScript 方法delay or wait 将脚本的执行延迟特定的时间只是为了补充其他人所说的内容setTimeout 如果以后想调用带参数的函数就需要设置一些匿名函数调用您需要将该函数作为参数
Golang 的 Codeclimate 测试覆盖率格式化程序

无处可去Codeclimate 文档 https docs codeclimate com v1 0 docs setting up test coverage section supported languages and formats
控制模板可见性触发器

我对下面的按钮样式所做的只是让按钮仅在 IsMouseOver 或 IsPressed 时可见它的编写方式甚至无法编译找不到 Glyph 如何清理这个问题直到 IsMoueOver 时按钮可见 Cheers Berryl
我应该等待 ValueTask 吗？

这将是一个有效的实施ValueTask请缓存服务从缓存或数据库返回数据 public async ValueTask
如何在 PowerShell 中检查现有文件后关闭表单 GUI？

我想检查一个现有的文件如果进程仍在等待该文件它将显示一个GUI窗口文件存在后窗口将自动关闭我尝试了这段代码窗口无法关闭即使文件已经存在检查文件 SN 708TSTA MAC 2E5961370 function Find n
R根据条件返回列名

对于以下数据框 DF lt data frame Row c 1 2 3 4 5 2 04 c 1 1 0 1 1 2 05 c 0 0 0 0 1 2 06 c 1 0 0 0 1 2 07 c 1 0 0 0 1 2 08 c 1 1
具有多个父项的 Activity 的 Android 向上导航

我在实施时遇到问题向上导航在具有此导航树的应用程序上后退按钮的标准实现很好当尝试实现向上按钮时问题就开始了我的期望当用户开机时详情 5 活动然后按向上按钮应用程序将转到清单 3 活动当用户开机时详情 7 活动然后按向上按钮应用
SQLite - 替换字符串的一部分

是否可以使用SQL in an SQLite表替换部分字符串例如我有一个表其中一个字段保存文件的路径是否可以替换字符串的某些部分例如 c afolder afilename bmp becomes c anewfolder afi
Ruby Torrent 库

Ruby 有什么好的库可以与 BitTorrent 跟踪器一起使用吗下载或种子文件 rubyforge 上有一个 ruby torrent 库但它最后一次更新是在 2005 年似乎不再工作了参见 lib torrent ruby h
了解 C# 字段初始化要求

考虑以下代码 public class Progressor private IProgress
如何使用 PHP DOM 查询从 HTML 表中选择文本？

如何使用 PHP DOM 查询从 HTML 表格单元格获取文本 HTML 表格是 table tr th Job Location th td a href Kabul a td tr tr th Nationality th td Afg
C# 中的索引错误，其中数组应返回空数组但返回超出范围

我是 C 新手遇到错误需要让 DataPoints 数组返回空但无论出于何种原因我都会收到此错误我在这里做错了什么指数超出范围必须为非负数且小于集合 r n参数名称索引 var DataPoints new DataPoi
错误错误：StaticInjectorError（AppModule）[UserformService -> HttpClient]：

在尝试添加 PrimeNG 表时我在这里破坏了我的构建 https github com BillyCharter87 Tech O Dex UI tree BrokeIt https github com BillyCharter87
ISO UTC DateTime 格式作为 MVC 6 API 响应中的默认 json 输出格式

有谁知道如何在返回 DateTime 对象时将 MVC6 的 json 输出配置为默认为 ISO UTC DateTime 字符串格式在 WebApi2 中我可以设置 JsonFormatter SerializerSettings 并
如何为strip文件配置cmake

当我在发布模式下使用 cmake 时我有以下二进制文件 64 bit LSB executable x86 64 version 1 SYSV dynamically linked interpreter lib64 ld linux x
通过 Link Server 连接时，如何将 Oracle TIMESTAMP 数据类型转换为 SQL Server DATETIME2 数据类型。

我已经尝试过一些例子但到目前为止还没有工作我有一个Link Server SQL Server 2014 to an Oracle 12C Database 该表包含数据类型 TIMESTAMP 其数据如下 22 MAR 15 04 1
胖模型/瘦控制器与服务层[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我多年来一直使用 Net 开发企业应用程序我的应用程序通常有一个域模型其中包含映射到 SQL DB 表的实体我使用存储库模式依赖注入和服
梯度下降与随机梯度下降算法

我尝试在 MNIST 手写数字数据集包括 60K 训练样本上训练前馈神经网络我每次都迭代所有训练样本表演反向传播对于每个时期的每个这样的样本运行时间当然太长了我运行的算法是否命名为梯度下降我读到对于大型数据集使用随机梯度下降

梯度下降与随机梯度下降算法

梯度下降与随机梯度下降算法 的相关文章

随机推荐

热门标签

梯度下降与随机梯度下降算法的相关文章