Keras 中的 dropout 行为，rate=1（丢弃所有输入单元）不符合预期

2024-04-04

input0 = keras.layers.Input((32, 32, 3), name='Input0')
flatten = keras.layers.Flatten(name='Flatten')(input0)
relu1 = keras.layers.Dense(256, activation='relu', name='ReLU1')(flatten)
dropout = keras.layers.Dropout(1., name='Dropout')(relu1)
softmax2 = keras.layers.Dense(10, activation='softmax', name='Softmax2')(dropout)
model = keras.models.Model(inputs=input0, outputs=softmax2, name='cifar')

只是为了测试 dropout 是否有效..

我将辍学率设置为1.0

每个时期的状态应该被冻结，而不需要对参数进行任何调整

however the accuracy keep growing although i drop all the hidden nodes

怎么了？

不错的收获！

丹尼斯·索默斯（Dennis Soemers）上述评论中提到的问题似乎是这样的，Keras Dropout 层更改 dropout=0.0 的结果 https://github.com/tensorflow/tensorflow/issues/10845，尚未完全解决，并且当面临 1.0 的辍学率时，它会以某种方式出错[请参阅帖子末尾的更新]；修改显示的模型Keras MNIST MLP https://github.com/keras-team/keras/blob/master/examples/mnist_mlp.py例子：

model = Sequential()
model.add(Dense(512, activation='relu', use_bias=False, input_shape=(784,)))
model.add(Dropout(1.0))
model.add(Dense(512, activation='relu'))
model.add(Dropout(1.0))
model.add(Dense(num_classes, activation='softmax'))

model.compile(loss='categorical_crossentropy',
          optimizer=RMSprop(),
          metrics=['accuracy'])

model.fit(x_train, y_train,
          batch_size=128,
          epochs=3,
          verbose=1,
          validation_data=(x_test, y_test))

尽管所有神经元都被丢弃，但确实给出了一个正在训练的模型，正如您所报告的：

Train on 60000 samples, validate on 10000 samples
Epoch 1/3
60000/60000 [==============================] - 15s 251us/step - loss: 0.2180 - acc: 0.9324 - val_loss: 0.1072 - val_acc: 0.9654
Epoch 2/3
60000/60000 [==============================] - 15s 246us/step - loss: 0.0831 - acc: 0.9743 - val_loss: 0.0719 - val_acc: 0.9788
Epoch 3/3
60000/60000 [==============================] - 15s 245us/step - loss: 0.0526 - acc: 0.9837 - val_loss: 0.0997 - val_acc: 0.9723

尽管如此，如果您尝试使用 0.99 的 dropout 率，即将上述模型中的两个 dropout 层替换为

model.add(Dropout(0.99))

那么实际上您实际上没有进行任何培训，情况应该如此：

Train on 60000 samples, validate on 10000 samples
Epoch 1/3
60000/60000 [==============================] - 16s 265us/step - loss: 3.4344 - acc: 0.1064 - val_loss: 2.3008 - val_acc: 0.1136
Epoch 2/3
60000/60000 [==============================] - 16s 261us/step - loss: 2.3342 - acc: 0.1112 - val_loss: 2.3010 - val_acc: 0.1135
Epoch 3/3
60000/60000 [==============================] - 16s 266us/step - loss: 2.3167 - acc: 0.1122 - val_loss: 2.3010 - val_acc: 0.1135

UPDATE（在OP中Yu-Yang评论之后）：这似乎是设计选择 https://github.com/keras-team/keras/blob/master/keras/layers/core.py#L120（立即处理链接，请参阅下面的更新）当退出率等于 0 或 1 时不执行任何操作；这Dropout类仅生效

if 0. < self.rate < 1.

然而，正如已经评论的那样，在这种情况下发出警告消息（以及文档中的相关注释）可以说是一个好主意。

UPDATE（2021 年 7 月）：自 2018 年 1 月撰写答案以来发生了一些变化；现在，在引擎盖下，Keras 调用tf.nn.dropout https://github.com/keras-team/keras/blob/master/keras/layers/core/dropout.py#L116，这似乎不允许dropout=1 (source https://github.com/tensorflow/tensorflow/blob/v2.5.0/tensorflow/python/ops/nn_ops.py#L5185).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras 中的 dropout 行为，rate=1（丢弃所有输入单元）不符合预期的相关文章

python 中的并行处理

在 python 2 7 中进行并行处理的简单代码是什么我在网上找到的所有示例都很复杂并且包含不必要的代码我该如何做一个简单的强力整数分解程序在每个核心 4 上分解 1 个整数我真正的程序可能只需要2个核心并且需要共享信息我知
Pandas：GroupBy 到 DataFrame

参考这个关于 groupby 到 dataframe 的非常流行的问题 https stackoverflow com questions 10373660 converting a pandas groupby object to dat
Python - 来自 .进口

我第一次尝试图书馆我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些糟糕也许只是因为我不记得经常看到它尽管公平地说我还没有深入研究
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
在没有模型的情况下将自定义页面添加到 django admin

我正在尝试在没有模型关联的情况下向管理员添加自定义页面这就是我迄今为止所取得的成就 class MyCustomAdmin AdminSite def get urls self from django conf urls import
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
Emacs 24.x 上的 IPython 支持

我对 IPython 与 Emacs 的集成感到困惑从 Emacs 24 开始 Emacs 附带了自己的python el 该文件是否支持 IPython 还是仅支持 Python 另外维基百科 http emacswiki org e
在 matplotlib 中的极坐标图上移动径向刻度标签

From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
Python新式类和__subclasses__函数

有人可以向我解释为什么这有效在 Python 2 5 中 class Foo object pass class Bar Foo pass print Foo subclasses 但这不是 class Foo pass class Ba
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
用 python 编写的数学语法检查器

我需要的只是使用 python 检查字符串是否是有效的数学表达式为了简单起见假设我只需要运算符也作为一元带有数字和嵌套括号为了完整性我还添加了简单的变量名称所以我可以这样测试 test 3 2 1 valid test 3
在系统托盘中隐藏 tkinter 窗口 [重复]

这个问题在这里已经有答案了我正在制作一个程序来提醒我朋友的生日这样我就不会忘记祝福他们为此我制作了两个 tkinter 窗口 1 First one is for entering name and birth date 2 Sec
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
如何为不同操作系统/Python 版本编译 Python C/C++ 扩展？

我注意到一些成熟的Python库已经为大多数架构 Win32 Win amd64 MacOS 和Python版本提供了预编译版本针对不同环境交叉编译扩展的标准方法是什么葡萄酒虚拟机众包我们使用虚拟机和Hudson http hud
Apache Beam Pipeline 写表后查询表

我有一个 Apache Beam Dataflow 管道它将结果写入 BigQuery 表然后我想查询该表以获取管道的单独部分但是我似乎无法弄清楚如何正确设置此管道依赖性我编写的新表然后想要查询与一个单独的表连接以进行某些过滤

随机推荐

为什么此代码会生成“潜在资源泄漏”警告？

Eclipse Juno 给出以下警告潜在的资源泄漏 os 可能未关闭在第一行try这段代码中的主体 static void saveDetails byte detailsData OutputStream os null try o
Open Office 和颠覆兼容性

有人有过使用 Subversion 将 OpenOffice 文档置于源代码管理之下的经验吗特别是 Subversion 是否正确有效地合并文档等乌龟SVN http tortoisesvn tigris org 具有 ODT 和 O
在 pandas 数据框中选择行时如何保持顺序？

我想按照列表中给出的特定顺序选择行例如这个数据框 a car 1 bike 3 jewel 2 tv 5 phone 6 df pd DataFrame a columns items quantity gt gt gt df item
更改 Spark Dataframe 中所有“双精度类型”列的小数精度

我有一个火花DataFrame 我们说 df 我对此做了以下简单的聚合DataFrame df groupBy sum 这样做后我得到以下异常 java lang IllegalArgumentException requirement
在 aspx 页面中使用 if else 和 eval

有没有办法在 aspx 页面上的以下 eval 中使用 else if 目前我的div如下 div class tooltip style display none div style text align center font weig
使用 ts-node 执行打字稿文件时出错（将项目安装为全局模块后）

使用 Windows 8 1 64 位纱线我正在尝试创建一个全局模块其中包含打字稿文件并使用ts node 并且不将文件转换为js 示例项目位于github https github com gmastergreatee test t
汇总不同聚合级别的数据 - R 和 tidyverse

我正在创建一堆基本状态报告我发现乏味的一件事是向我的所有表添加总行我目前正在使用 Tidyverse 方法这是我当前代码的示例我正在寻找的是默认包含几个不同级别的选项 load into RStudio viewer not req
改造以解析具有不定数量的对象名称的 json

我正在使用 Retrofit 来处理 REST API 调用我有一个返回以下 json 的 REST API MyObject 43508 field1 4339 field2 val field3 15 field4 586 78 10
Ruby XML 到 JSON 转换器？

Ruby 中有一个库可以将 XML 转换为 JSON 吗一个简单的技巧首先你需要gem install json 那么当使用 Rails 时你可以这样做 require json require active support core
重载强制转换运算符时出现歧义

考虑下面的示例代码 include
Heartbleed bug 是 C 语言中经典缓冲区溢出漏洞的表现吗？

在我们关于安全性的第一堂 CS 讲座中我们了解了 C 的问题即不检查所谓的缓冲区长度以及利用此漏洞的不同方式的一些示例在这种情况下看起来这是一个恶意读取操作的情况应用程序只是读出了多少字节的内存我断言 Heartbleed b
Objective-C 依赖项的弃用警告

使 Swift var 向后兼容 Objective C 我有一个 Objective C 类已转换为 Swift 我所有的测试都通过了但我想通过添加一个弃用警告来更新以通知用户将下游依赖项更新到 Swift 版本的 var 来进一步优
为什么更好的隔离级别意味着 SQL Server 更好的性能

在测量查询性能时我发现隔离级别和运行时间之间存在依赖关系这让我感到惊讶 READUNCOMMITTED 409024 READCOMMITTED 368021 REPEATABLEREAD 358019 SERIALIZABLE 348
如何修改移动设备和选项卡的引导轮播

我正在使用引导滑块在桌面上它有三张幻灯片每张幻灯片有 4 个图块在选项卡上它们必须是 4 张幻灯片每张幻灯片 3 个图块在移动设备上需要有 12 张不同的幻灯片我正在考虑实现这一点的最有效和最优化的方法 Option 1
Hibernate3 与 Oracle 12c

我们正在将 oracle 从 11g 升级到 12c 我的应用程序正在使用hibernate3 jar这是 3 6 8 最终版本与 11g 配合使用效果很好Oracle10gDialect但是当我连接到 12c 数据库时出现以下错误我还
使用 ezplot 在 MATLAB 中的同一个图形上绘制两个函数

我想使用 ezplot 在 MATLAB 中绘制以下三个函数但我希望这些函数位于同一张图上以便轻松解释差异这可能吗如果是这样怎么办这三个功能是 x 3 x 5 x 7 thanks 神秘的xhobo 只需使用hold on将它们连
什么是缩放图像以及如何在网页中提供缩放图像？

当我在 google PageSpeed 中运行测试页面时我发现了一些警告例如提供缩放图像 http man vimal net78 net introduction intro action main THe results were
IEnumerable 是如何逆变的？

这个帖子 http blogs msdn com b brada archive 2005 01 18 355755 aspx https web archive org web 20140417104304 http blogs msdn
如何为 google api php 客户端库设置超时

我正在使用谷歌的PHP 客户端库 https github com google google api php client构建一个应用程序有时 Google 需要长达 100 秒的时间来响应 API 请求我想将套接字超时限制为 30
Keras 中的 dropout 行为，rate=1（丢弃所有输入单元）不符合预期

input0 keras layers Input 32 32 3 name Input0 flatten keras layers Flatten name Flatten input0 relu1 keras layers Dense

Keras 中的 dropout 行为，rate=1（丢弃所有输入单元）不符合预期

Keras 中的 dropout 行为，rate=1（丢弃所有输入单元）不符合预期 的相关文章

随机推荐

热门标签

Keras 中的 dropout 行为，rate=1（丢弃所有输入单元）不符合预期的相关文章