神经网络在一个纪元后趋于平坦

2024-03-04

我正在使用 keras 创建一个卷积神经网络，尝试将图像分类为两个不同的类，并且出于某种原因，在第一个纪元之后，准确性永远不会改变。

使用 Keras 后to_categorical()我的标签看起来像：

[[0.  1.]
[1.  0.]
[1.  0.]
[0.  1.]]

我的模型的代码是：

model = Sequential()
model.add(Conv2D(filters=32, kernel_size=[5, 5], strides=1, padding='same', activation='relu', input_shape=(imageSize, imageSize, 3)))
model.add(MaxPooling2D())
model.add(Conv2D(filters=64, kernel_size=[5, 5], strides=1, padding='same', activation='relu'))
model.add(MaxPooling2D())
model.add(Flatten())
model.add(Dense(2))
sgd = SGD()  # Use stochastic gradient descent for now
model.compile(loss='categorical_crossentropy', optimizer=sgd, metrics=['accuracy'])

model.summary()

counter = 0
# Train one cycle at a time so we can shuffle data inbetween
for x in range(trainingEpochs):

    counter += 1
    print()  # New line
    print('Epoch ' + str(counter))

    trainingImages, trainingLabels = shuffle(trainingImages, trainingLabels, random_state=0)  # Shuffle both sets in unison

    model.fit(x=trainingImages, y=trainingLabels, batch_size=32, epochs=1, verbose=2)

此代码的输出结果为：

Epoch 1
36s - loss: 5.0770 - acc: 0.3554

Epoch 2
36s - loss: 4.9421 - acc: 0.3066

Epoch 3
36s - loss: 4.9421 - acc: 0.3066

Epoch 4
36s - loss: 4.9421 - acc: 0.3066

到目前为止，我已经尝试过更改批量大小、使用binary_crossentropy、更改洗牌方法、更改卷积参数、使用黑白照片而不是RGB、使用不同尺寸的图片、使用ADAM而不是SGD以及使用较低的学习率对于 SGD，但这些都没有解决问题。我很茫然，有人有什么想法吗？

编辑：trainingImages 的形状为 (287, 256, 256, 3)（如果这很重要的话）。

症状是训练损失相对较早地停止改善。假设你的问题是可以学习的，那么造成这种行为的原因有很多。这些是我的头顶想法：

输入预处理不当：

神经网络更喜欢零均值的输入。例如，如果输入全部为正，它将限制权重在同一方向上更新，这可能是不可取的（https://youtu.be/gYpoJMlgyXA https://youtu.be/gYpoJMlgyXA).

因此，您可能需要从所有图像中减去平均值（例如，从 3 个通道中的每一个通道中减去 127.5）。缩放以使每个通道中的单位标准差也可能有所帮助。

网络的泛化能力：

网络对于该任务来说不够复杂或不够深。

这很容易检查。您只需使用几张图像（例如 3 到 10 张）即可训练网络。网络应该能够过度拟合数据并将损失驱动到几乎为 0。如果不是这种情况，您可能需要添加更多层，例如使用超过 1 个 Dense 层。

另一个好主意是使用预先训练的权重（在 Keras 文档的应用程序中）。您可以调整顶部的密集层以适应您的问题。

权重初始化不当。

不正确的权重初始化会阻止网络收敛（https://youtu.be/gYpoJMlgyXA https://youtu.be/gYpoJMlgyXA，与之前相同的视频）。

对于 ReLU 激活，您可能希望使用 He 初始化而不是默认的 Glorot 初始化。我发现有时这可能是必要的，但并非总是如此。

最后，您可以使用 Keras 调试工具，例如 keras-vis、keplr-io、deep-viz-keras。它们对于打开卷积网络的黑匣子非常有用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络在一个纪元后趋于平坦的相关文章

Python 中的舍入浮点问题

我遇到了 np round np around 的问题它没有正确舍入我无法包含代码因为当我手动设置值而不是使用我的数据时返回有效但这是输出 In 177 a Out 177 0 0099999998 In 178 np rou
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
Python beautifulsoup 仅限 1 级文本

我看过其他 beautifulsoup 得到相同级别类型的问题看来我的有点不同这是网站我正试图拿到右边那张桌子请注意表的第一行如何展开为该数据的详细细分我不想要那个数据我只想要最顶层的数据您还可以看到其他行也可以展开但在本例
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
如何在 MacBook Pro 上的 Docker 容器内运行 tkinter？

我正在尝试运行一个使用以下命令的 python GUI 应用程序tkinter我的 MacBook Pro 上的 docker 容器内的模块所以我安装了XQuartz https www xquartz org 并跟随本教程 https
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m

随机推荐

VS2008 PDB 文件大小限制还原：LNK1201 也是

VS2k8 中 PDB 文件的大小限制是多少我在一个开发工作站上 32 位 PAE 内核上的 RAM 和页面文件各为 3GB 但在 PDB 增长超过 1GB 后不久链接器就抛出了 LNK1201 错误 MSPDBSRV 是否只是耗尽了地
正则表达式提取文件名

我有一个纯文本网络响应需要提取文件名对于好的正则表达式有什么建议吗 Total parts 1 Name file Content Type text plain Size 1167 content type text plain co
有没有办法设置 HTML5 范围控件的样式？

有没有办法设置 HTML5 范围控件的样式是否可以更改滑块滑动的线条的颜色事实证明 webkit中有 input type range webkit appearance none important input type range
无法匹配 C 中的正则表达式

我对以下正则表达式有问题 prefix w w s 0 9 1 4 s s 0 9 1 4 s s 0 9 1 4 s w 匹配字符串如下 prefix string string 100 100 0 string 我无法在我的 C 代码中
多个表上的 FreeText COUNT 查询超级慢

我有两张桌子 Product ID Name SKU Brand ID Name 产品表大约有120K条记录品牌表有30K条记录我需要查找名称和品牌与特定关键字匹配的所有产品的数量我使用自由文本包含如下所示 SELECT coun
验证、方法执行和JIT编译过程中类加载的原因和跟踪

我试图非常详细地了解哪些事件会导致类加载并且在测试过程中我在这个非常基本的示例中遇到了一种我不理解的行为 public class ClinitTest public static Integer num public static L
Emacs：是否可以列出 dired 中标记文件的某个查询字符串的所有匹配行？

前几天我发现 M x 发生了 Emacs中如何实现代码折叠效果 https stackoverflow com questions 1085170 how to achieve code folding effects in emacs 我
转换为 Vector' aria-label='无法将类型转换为 Vector'> 无法将类型转换为 Vector

给定我的 pyspark Row 对象 gt gt gt row Row clicked 0 features SparseVector 7 0 1 0 3 1 0 6 0 752 gt gt gt row clicked 0 gt gt
无法在l5-swagger中生成API文档

我开始学习招摇了我正在尝试做书上所做的同样的事情使用 Angular 6 和 Laravel 5 进行全栈 Web 开发实践输入命令后使用 php fpm bash php artisan l5 swagger generate 我在
jQuery .when().done() 不工作

首先我想说我是 jQuery 的新手我怀疑我只是做了一些愚蠢的事情所以希望这对某人来说会很简单我正在尝试向我的网站添加滑动移动子菜单我想要一种手风琴效果如果我单击一个父链接它的子子菜单将打开所有其他子菜单将关闭问题在于时间
Console.ReadLine() 在 VS Code 中不起作用，用 C# 编写代码

我正在学习 C 并且正在使用 VS Code 当我尝试使用 Console ReadLine 从用户那里获取输入时它不起作用我从一个视频中提到了它它做了完全相同的事情但经过几次谷歌搜索后我仍然不知道我哪里出了问题 Console
将 ROW_NUMBER 列添加到流数据帧

我对 Spark 和 SQL 还很陌生我正在尝试向我的 df 添加一列然后将其保存到 Delta 表该列为每个记录行提供唯一的 id 并在每次更新特定记录时递增它我试图执行以下操作 SELECT etc CONCAT somero
类型错误：列表索引必须是整数或切片，而不是列表

数组某种具有 3 列和无限数量的行且其中包含数据的列表 Volume array 0 2 counter 0 for i in array if Volume array i 2 lt why is this line a problem
哪些 GOF 设计模式具有完全不同的实现（java 与 Scala）

最近我读到以下问题在 Scala 中是否有使用访问者模式的用例我是否应该在每次使用 Scala 时都使用模式匹配 Java 中的访问者模式标题问题的链接 Scala 中的访问者模式 https stackoverflow com qu
文本编辑器的数据结构

这是一道面试题您将使用什么数据结构来存储文本编辑器中的文本在老式的 ZX Spectrum 上一个或多个我不知道文本编辑器使用了非常简单的结构有一个很大的缓冲区占用了所有空闲 RAM 文本在光标处分成两部分光标之前的部分放
Gradle：如何通过运行 Gradle 4.1 任务通过 eclipse ECJ（JDT 核心）编译 Java

我有一个可以很好构建的项目日食欧洲法院 But 甲骨文javac无法构建它一些原因如链接中所示 ecj和javac的区别 https stackoverflow com questions 3061654 what is the dif
C语言中的二维数组如何变成一维数组？

如果有人可以向我解释以下行为我将不胜感激假设我声明一个静态二维数组 float buffer NX NY 现在如果我想填充这个数组我注意到可以这样做 initarray buffer NX NY define INITDATAVAL
没有 Redux 的情况下组合Reducer

我有一个没有 redux 的应用程序我使用钩子和钩子 useReducer context 处理全局状态我有 1 个 useReducer 它就像一个 Redux 商店但要做到这一点我只能发送 1 个减速器在该减速器中我拥有所有状
根据数组中的另一个 id 仅对多数组中的第一项进行排序 (PHP)

我不知道该怎么做请参阅下面我的数组我在 while 循环中运行这个数组需要先找到 attach id 对于每个 topic id 并可以使用 topic id在循环中设置的正确的输出将是第一个循环 attach id gt 179
神经网络在一个纪元后趋于平坦

我正在使用 keras 创建一个卷积神经网络尝试将图像分类为两个不同的类并且出于某种原因在第一个纪元之后准确性永远不会改变使用 Keras 后to categorical 我的标签看起来像 0 1 1 0 1 0 0 1 我的模型

神经网络在一个纪元后趋于平坦

神经网络在一个纪元后趋于平坦 的相关文章

随机推荐

热门标签

神经网络在一个纪元后趋于平坦的相关文章