为什么不同的批量大小在 Keras 中给出不同的精度？

2024-03-13

我使用 Keras 的 CNN 对 MNIST 数据集进行分类。我发现使用不同的批量大小会产生不同的精度。为什么会这样呢？

使用批量大小 1000 https://i.stack.imgur.com/Ad4oO.png（加速器 = 0.97600）

使用批量大小 10 https://i.stack.imgur.com/CRLd3.png（加速器 = 0.97599）

虽然差别很小，但为什么会有差别呢？编辑-我发现差异只是因为精度问题，它们实际上是相等的。

这是因为训练过程中存在小批量梯度下降效应。你可以找到很好的解释Here https://machinelearningmastery.com/gentle-introduction-mini-batch-gradient-descent-configure-batch-size/我在这里提到了该链接的一些注释：

批量大小是学习过程中的一个滑块。

小值可以让学习过程快速收敛训练过程中的噪声成本。

大值可以学习通过准确估计误差而缓慢收敛的过程坡度。

该链接的一个重要说明是：

所呈现的结果证实，使用小批量可以实现最佳训练稳定性和泛化性能，对于考虑到计算成本，在广泛的实验中。在所有在批量大小 m = 32 或的情况下获得了最佳结果较小

这是以下结果这张纸 https://arxiv.org/abs/1804.07612.

EDIT

在这里我还应该提两点：

因为机器学习算法固有的随机性概念，通常您不应期望机器学习算法（如深度学习算法）在不同的运行中具有相同的结果。您可以找到更多详细信息Here https://machinelearningmastery.com/randomness-in-machine-learning/.
另一方面，您的两个结果太接近并且在某种程度上它们是相等的。因此，就您的情况而言，根据报告的结果，我们可以说批量大小对您的网络结果没有影响。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

Keras

deeplearning

convneuralnetwork

为什么不同的批量大小在 Keras 中给出不同的精度？的相关文章

具有多个输入的 Keras TimeDistributed 层

我正在尝试使以下代码行正常工作 low encoder out TimeDistributed AutoregressiveDecoder X tf embeddings Where AutoregressiveDecoder是一个需要两个
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
我的 R 平方分数为负，但使用 k 倍交叉验证的准确度分数约为 92%

对于下面的代码我的 r 平方分数为负但使用 k 折交叉验证的准确度分数为 92 这怎么可能我使用随机森林回归算法来预测一些数据数据集的链接在下面的链接中给出 https www kaggle com ludobenistant hr
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
输入维度/分辨率会影响卷积神经网络的性能吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在构建一个图像分类器其中有 66 个类和大约 50000 个图像我的电脑内存为 12 GB 我的内存不足以训练图像我的问题是
模块“tensorflow”没有属性“random_uniform”

我尝试执行一些深度学习应用程序并收到模块 tensorflow 没有属性 random uniform 错误在 CPU 上代码运行良好但速度非常慢为了在 GPU 上运行代码我需要更改一些定义下面是我的代码有任何想法吗 def
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
在 SciKit-Learn 中使用 Pipeline 计算排列重要性

我正在使用来自的确切示例SciKit https scikit learn org stable auto examples inspection plot permutation importance html sphx glr auto
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
批量归一化，是还是否？

我使用 Tensorflow 1 14 0 和 Keras 2 2 4 以下代码实现了一个简单的神经网络 import numpy as np np random seed 1 import random random seed 2 imp
选择 c 和 gamma 值

您好我正在使用 SMO 执行 SVM 分类其中我的内核是 RBF 现在我想选择c and sigma值使用网格搜索和交叉验证我是内核函数的新手请帮助一步一步的过程选择一些您认为有趣的 C 和 sigma 值例如 C 1 10
Caffe 的 LSTM 模块

有谁知道 Caffe 是否有一个不错的 LSTM 模块我从 russel91 的 github 帐户中找到了一个但显然包含示例和解释的网页消失了以前是http apollo deepmatter io http apollo deep
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
了解 YOLO 是如何训练的

我试图了解 YOLO v2 是如何训练的为此我使用这个 keras 实现https github com experiencor keras yolo2 https github com experiencor keras yolo2在
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

OSX 10.8 xcrun（没有这样的文件或目录）

执行时gem install jekyll在 OSX 10 8 上安装了来自 Apple 开发人员站点的独立命令行工具包无 Xcode 时我遇到以下错误构建本机扩展这可能需要一段时间错误安装 jekyll 时出错错误无法构建
SQL 查询限制来自一个表的行，而不是结果集

我正在运行一个带有连接的简单查询类似于 SELECT t1 a t2 b FROM t1 LEFT JOIN t2 ON LIMIT 5 As t1有很多行t2 任何大于 2 的数字 LIMIT 语句不会返回前 5 行t1以及来自的相应条
const 有什么问题吗？

已知的不足有哪些const在 C 和 C 0x 中唯一的问题是const就是这样被严重低估许多开发商它是 C 工具箱中最好的工具之一非常锋利但割伤自己并不危险
禁用的 uibarbuttonitem 的文本颜色始终是正常状态的颜色

我在我的代码中写道 UIBarButtonItem appearanceWhenContainedIn UINavigationBar class nil setTitleTextAttributes NSForegroundColorAt
限制 Jenkins 仅针对特定分支进行并发构建

我一直在寻找如何做到这一点一段时间但我开始认为这是不可能的与此类似的每个问题似乎都与限制某些节点或整个管道的运行更相关我们在 Jenkins 中有一个多分支管道用于处理 PR 构建分阶段测试和生产发布三者中的每一个都通过when
VC++ 缺少类型说明符 - 假定为 int。注意：C++ 不支持default-int [重复]

这个问题在这里已经有答案了以下代码在 VC 6 0 中编译得很好但是当我在 VS2005 中打开该项目时出现此错误 BCGPopupMenu h 100 错误 C4430 缺少类型说明符 int 假定注意 C 不支持default
为可移植类库创建 NuGet 包时出错

我是 Nuget 新手我正在尝试为可移植类库项目创建一个 NuGet 包该项目对我创建的另一个可移植类库具有包依赖性我遇到了一个问题在调用时收到错误块包对于项目文件测试组件2 csproj 我从 VS 2013 中的 Portabl
&（单个与符号）和 | 是什么意思（单管）运算符进行比较运算？

在这样的声明中 if valueA valueB 99 print they don t equal 99 什么是运营商做什么我认为这意味着如果 valueS 和 value 都不等于 99 则执行该块然后什么是在此声明中执行以下操
在zf2中配置多个数据库

如何在 Zend Framework 2 中配置和使用多个数据库目前我的 global php 中有这个 return array db gt array driver gt Pdo dsn gt mysql dbname my db
Pythoncoverage.py 排除行

背景我有几个使用coverage py 的Django 项目并且一直在尝试向我的 coveragerc 配置文件的exclude lines 部分添加一些额外的表达式问题是即使使用正确的正则表达式也可以在测试器中拾取该行例如ht
删除字符串中的所有 HTML 标签（使用 jquery text() 函数）

是否可以使用 jquery text 函数删除字符串中的所有 HTML 带有 HTML 标签的字符串 myContent div Hello span world span div 结果必须是 Hello world var myConte
C# 中字符串类型最快（内置）比较是什么

C 中字符串类型最快的内置比较方法是什么我不介意印刷语义含义目的是在排序列表中使用比较器以便在大型集合中快速搜索我认为只有两种方法 Compare and CompareOrdinal 什么是最快的此外是否有更快的字符串比较方法
拍照后编辑图像

我目前正在制作一个 iPhone 应用程序用户可以在其中拍照或从相册中选择照片然后将覆盖层放置在图像上然后用户可以缩放旋转和保存图像目前我可以拍照或者选择一张放入相册至于覆盖层我只是使用 UIImageView 并将其放置
AngularJS：AppLevel 控制器可能吗？

我有一个控制器它是我的页面的控制器但我想知道是否有可能有一个 AppLevel 控制器即可以从每个页面访问的东西所以每个页面实际上会分配超过 1 个控制器我知道我可能可以通过服务来做到这一点并注入服务但我希望有某种可以分配的应用
x86_64 将 64 位寄存器减少到 32 位并保留零或非零状态的最佳方法

我正在寻找最快最节省空间的方法将 64 位寄存器减少为 32 位寄存器仅保留 64 位寄存器的零非零状态我目前适用于所有价值观的最佳想法是popcntq 1c tput 主流 Intel 上的 3c 延迟 5 字节代码大小 rax
对一个列表与另一个列表 ID 进行排序

我有一个包含一些标识符的列表如下所示 List
如何通过 jq 的“join”函数使用换行符 (\n) 和制表符 (\t) 等非显示字符

我在互联网上找不到这个所以我想将其添加为文档我想在非显示字符周围加入一个 json 数组 30 RecordSeparator 这样我就可以在 bash 中安全地迭代它但我不太清楚该怎么做我试过echo one two three
Percona 的 pt-table-sync：如何在多个表上运行？

在命令行中这将成功更新 table1 pt table sync execute h host1 D db1 t table1 h host2 D db2 但是如果我想更新多个表我不知道如何编写它这也只更新 table1 并忽略其他
警告：道具类型失败：未在“DimensionPicker”中指定必需的道具“dimensionName”。检查`Connect(DimensionPicker)`的渲染方法

我有以下 Redux React 组件 import PropTypes React Component from react import Select from react select class DimensionPicker ex
为什么不同的批量大小在 Keras 中给出不同的精度？

我使用 Keras 的 CNN 对 MNIST 数据集进行分类我发现使用不同的批量大小会产生不同的精度为什么会这样呢使用批量大小 1000 https i stack imgur com Ad4oO png 加速器 0 97600 使

为什么不同的批量大小在 Keras 中给出不同的精度？

为什么不同的批量大小在 Keras 中给出不同的精度？ 的相关文章

随机推荐

热门标签

为什么不同的批量大小在 Keras 中给出不同的精度？的相关文章