随机梯度下降可以与 TensorFlow 一起使用吗？

2024-05-06

我设计了一个全连接 MLP，具有 2 个隐藏层和 1 个输出层。如果我使用批量或小批量梯度下降，我会得到一个很好的学习曲线。

But a straight line while performing Stochastic Gradient Descent (violet)

我做错了什么？

根据我的理解，如果每个训练步骤只提供一个训练/学习示例，我会使用 Tensorflow 进行随机梯度下降，例如：

X = tf.placeholder("float", [None, amountInput],name="Input")
Y = tf.placeholder("float", [None, amountOutput],name="TeachingInput")
...
m, i = sess.run([merged, train_op], feed_dict={X:[input],Y:[label]})

其中输入是 10 分量向量，标签是 20 分量向量。

对于测试，我运行 1000 次迭代，每次迭代包含 50 个准备好的训练/学习示例之一。我预计 nn 会过度拟合。但正如你所看到的，它没有学习:(

由于神经网络将在在线学习环境中执行，因此小批量或批量梯度下降不是一种选择。

感谢您的任何提示。

批量大小影响有效学习率。

如果您考虑单个参数的更新公式，您会发现它是针对输入批次中的每个元素对该参数计算的各个值进行平均而更新的。

这意味着，如果您正在使用大小为 n 的批量大小，则每个参数的“实际”学习率约为learning_rate/n。

因此，如果您使用大小为 n 的批次训练的模型训练没有问题，这是因为该批次大小的学习率还可以。

如果你使用纯随机梯度下降，你必须降低学习率（通常是 10 的幂）。

因此，举例来说，如果你的学习率是1e-4批量大小为128，尝试使用学习率1e-4 / 128.0看看网络是否学习（它应该学习）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

gradientdescent

随机梯度下降可以与 TensorFlow 一起使用吗？的相关文章

应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
在 TensorFlow 中，tf.identity 有何用途？

我见过tf identity在一些地方使用过例如官方 CIFAR 10 教程和 stackoverflow 上的批量规范化实现但我不明白为什么有必要它是用来做什么的谁能给出一两个用例吗一种建议的答案是它可以用于 CPU 和 GPU
Tensorflow Hub - 获取模型的输入形状和问题域？

我正在使用最新版本的tensorflow hub 想知道如何获取有关模型的预期输入形状以及模型属于什么类型的集合的信息例如有没有办法以这种方式在 Python 中加载模型后获取有关预期图像形状的信息 model hub load htt
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get

随机推荐

使用 SimpleXML 从 XML 获取多个项目

我正在尝试使用下面的代码循环 XML 中的多个项目 xml get data the url data simplexml load string xml foreach data gt item AS item foreach item
在 iOS 8 上本地化用户

你好我开始将我的应用程序移植到 iOS 8 但很快我就遇到了 CLLocationManager 的问题基本上该应用程序不再将地图集中在用户位置上而是提出错误尝试启动 MapKit 位置更新而不提示位置授权必须首先调用 CLLo
Jasmine的spyOn()是否允许执行spies on函数？

茉莉花有吗spyOn 方法允许执行监视函数或者确实是这样当即将调用监视方法时拦截调用并返回true PS 谁能给我解释一下spyOn 的内部运作 Spy 间谍可以伪装成一个函数或一个对象您可以在编写单元测试代码时使用它们来检查函
'NSDate' 没有可见的 @interface 声明选择器 'initWithString:' [重复]

这个问题在这里已经有答案了可能的重复 NSDate initWithString https stackoverflow com questions 7770257 nsdate initwithstring 我写了下面一行代码 NSDa
翻转旋转和图像

我正在用 Java 编写一个平台游戏并且正在手动编码玩家动画我分别为每个肢体设置动画改变位置和旋转当玩家面向右时这工作得很好但是当玩家面向左时我不知道如何处理旋转以使它们在玩家向左转时看起来相同每个身体部位的位置都是相对于
有没有办法使用 Mayavi 填充陀螺仪表面的一侧？

我正在使用 Mayavi 绘制陀螺仪的等值面我的问题是我需要通过填充两个生成区域的一侧来获得更坚固的结构在下面的图片中您可以看到我生成的等值面的外观以及填充一侧后的外观我生成的等值面它应该是什么样子等值面可以通过以下方程生成 U
Swift 中的 NSCollectionView 选择处理

使用 Swift 学习我一整天都在做这件事但进展甚微需要知道何时选择 NSCollectionView 中的项目最终目标是让项目突出显示并能够使用删除键将其从集合中删除我的 NSCollectionView 绑定到 ArrayC
在 eclipse indigo 中找不到 Window builder pro

我读到 Eclipse Indigo 安装了 Window Builder Pro 插件但我不知道它在哪里文件新建项目没有给我选择 Window Builder Pro 的选项如何找到它您需要将此更新站点添加到 Eclipse
Font Awesome 4.0.0 缺少图标

是我一个人的问题还是 FontAwesome 3 x x 中实际上有 FontAwesome 4 0 0 中缺少的图标如果是这样这肯定会让 FontAwesome 对我来说不再那么棒例如我似乎找不到相当于icon remove 没
java格式化表格输出

所以我正在尝试格式化我的输出 System out println Menu nItem tItem t tPrice tQuantity for int i 0 i
jQuery 单击事件更改 php 会话变量

对此最好的方法是什么因为正如我发现的只有在尝试过之后才完全有意义 p 你不能在 javascript 条件下设置 PHP 变量杜尔赫我能想到的唯一解决方案是对一个处理会话变量的小型 PHP 文件进行 AJAX 调用 elm cli
给定字符串的所有可能排列？

我该如何在 Ruby 中做到这一点 p abc all possible permutations 将返回 abc acb bca bac cba cab Edit 感谢雅库布汉普尔 class String def all possib
仅以 int 形式显示和保存小时数

如何仅显示小时并使用 int 变量我的意思是打印时间例如 20 30 44 PM 我只想存储小时即 int 变量中的 20 小时怎么做有谁知道的话可以告诉我密码吗谢谢尝试使用日历get http docs oracle com
无法让 Rails Server 与 MySQL 一起使用

我正在尝试让我的 Rails 应用程序与 MySQL 一起使用而不是默认的 SQLite 我创建了一个新项目强制使用 MySQL 它似乎工作正常它在 Gem 文件中添加了 gem 条目如下所示 source https rubyge
StateObject 作为 init() 中另一个对象的参数

我试图将 StateObject 用户传递给authenticationHelper 但我不能因为 IDE 说在初始化所有存储的属性之前使用 self 即使它是在结构体的开头初始化的我考虑过将 user 的初始化移至 init 但同样
Windows批处理编程中的用户输入操作

我想以 ddmmyyyy 格式接受用户的输入当用户以这种格式输入日期时文件将移动到相应的文件夹我尝试了以下代码但失败了 SET p str 输入文件夹的名称例如30062011 移动 C Documents and Settings
如何从图书馆创建承诺

我对此感到困惑因为到目前为止我发现的每个教程都假设我可以编辑库代码或者库只有回调或回调作为最后一个参数我正在使用的库的每个功能都设置为function successCallBack result FailCallBack error
java中使用awt.Toolkit和Clipboard是否可以知道剪贴板中复制的内容是否是mp3文件

我正在尝试编写一个运行于背景 and monitors复制 a 的复制操作 mp3 file or a 文件夹包含 a mp3 file Clipboard cb Toolkit getDefaultToolkit getSystemCli
返回值必须是 ?Illuminate\\Database\\Query\\Builder, App\\Models\\ModelName 返回的类型

我试图得到以下回应 user id 1 first name john last name doe email email protected cdn cgi l email protection phone number 12345678
随机梯度下降可以与 TensorFlow 一起使用吗？

我设计了一个全连接 MLP 具有 2 个隐藏层和 1 个输出层如果我使用批量或小批量梯度下降我会得到一个很好的学习曲线 But a straight line while performing Stochastic Gradient D

随机梯度下降可以与 TensorFlow 一起使用吗？

随机梯度下降可以与 TensorFlow 一起使用吗？ 的相关文章

随机推荐

热门标签

随机梯度下降可以与 TensorFlow 一起使用吗？的相关文章