如何在 Keras 中故意过度拟合卷积神经网络以确保模型正常工作？

2024-03-08

我正在尝试诊断训练模型时导致精度低的原因。此时，我只想能够获得高训练精度（我可以稍后担心测试精度/过度拟合问题）。如何调整模型以提高训练准确性？我想这样做是为了确保我在预处理步骤（洗牌、分割、标准化等）中没有犯任何错误。

#PARAMS
dropout_prob = 0.2
activation_function = 'relu'
loss_function = 'categorical_crossentropy'
verbose_level = 1
convolutional_batches = 32
convolutional_epochs = 5
inp_shape = X_train.shape[1:]
num_classes = 3


def train_convolutional_neural():
    y_train_cat = np_utils.to_categorical(y_train, 3) 
    y_test_cat = np_utils.to_categorical(y_test, 3)

    model = Sequential()
    model.add(Conv2D(filters=16, kernel_size=(3, 3), input_shape=inp_shape))
    model.add(Conv2D(filters=32, kernel_size=(3, 3)))
    model.add(MaxPooling2D(pool_size = (2,2)))
    model.add(Dropout(rate=dropout_prob))
    model.add(Flatten())
    model.add(Dense(64,activation=activation_function))
    model.add(Dense(num_classes,activation='softmax'))
    model.summary()
    model.compile(loss=loss_function, optimizer="adam", metrics=['accuracy'])
    history = model.fit(X_train, y_train_cat, batch_size=convolutional_batches, epochs = convolutional_epochs, verbose = verbose_level, validation_data=(X_test, y_test_cat))
    model.save('./models/convolutional_model.h5')

您需要删除 Dropout 层。这是一个针对故意过度拟合的小清单：

删除任何正则化（Dropout、L1 和 L2 正则化）
确保设置较慢的学习速率（Adam 是自适应的，所以在你的情况下没问题）
您可能不想打乱训练样本（例如，所有前 100 个样本都是 A 类，接下来的 100 个样本是 B 类，最后 100 个样本是 C 类）。Update: 正如所指出的彼得苏黎世在下面的答案中，应谨慎考虑这一点，因为它可能根本没有任何训练效果。

现在，如果您很容易过度拟合模型，那么这是一个好兆头strong模型，能够表示数据。否则，您可能会考虑更深/更广泛的模型，或者您应该仔细查看数据并提出问题：“真的有任何模式吗？这是可以训练的吗？”。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Keras 中故意过度拟合卷积神经网络以确保模型正常工作？的相关文章

CVXPY 二次规划； ArpackNoConvergence 错误

我尝试使用 Python 包 CVXPY 来解决第一种形式的凸二次规划问题 https www cvxpy org examples basic quadratic program html https www cvxpy org exam
如何修复 Apache mod_wsgi 的 Python 版本不匹配问题？

我收到此错误 Thu Jul 12 14 31 36 2012 error python init Python version mismatch expected 2 6 7 found 2 6 8 当尝试启动 Apache 服务器时在
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
Windows Defender 检测 Python EXE 为木马

我制作了一个 Python 脚本将 Windows 目录以 zip 形式邮寄给我我使用 sched 模块添加了一个调度程序每小时重复一次我试图制作一个简单的同步应用程序供个人使用在 Windows 启动时启动我使用将其转换为 e
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
如何加速 pandas 字符串函数？

我正在使用 pandas 矢量化 str split 方法来提取从上的拆分返回的第一个元素我还尝试使用 df apply 与 lambda 和 str split 来产生等效的结果使用 timeit 时我发现 df apply 的
Python 队列 get()/task_done() 问题

我的消费者端队列 m queue get queue task done
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a
部署 Flask 应用程序时如何检测额外文件的更改并重新加载应用程序？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我在 Flask 中构建了一个小型 Web 应用程序并尝试将其部署在 Pythonanywhere 上在开发过程中

随机推荐

在 .NET 对象上设置 Enum 属性

从这个问题继续在 NET 对象上设置可为空属性 https stackoverflow com questions 61334031 setting a nullable property on a net object 感谢奥利维尔
更新分布式 MS Project global.mpt 文件中的 VBA 代码模块

我负责修改MS Project的Global文件它包含一个不断更新的定制模块我将其分发给不具备计算机技能来更新自己的文件的其他用户我知道这只是复制粘贴我想知道是否有一种方法可以在全局文件中编写一些内容来检查共享驱动器上存储的最新版本
RStudio 在 Web 浏览器中打开文档

当我在 RStudio 的帮助框中输入函数名称时我得到的答案是在 Web 浏览器而不是 RStudio 帮助窗口中打开的输入时也会发生同样的情况 function例如 which 这样做时我还在控制台中收到以下错误 gt which
C ：使用重复平方而不使用递归函数的 x 次方 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案这是我的代码它计算 2 的 16 次方 include
如何从内容页面调用嵌套在 RadDockableObject 内部的用户控件内部的方法？

这是我的代码我能够找到 Asp net UserControl 并使用属性但我需要调用其中的特定方法谁能告诉我该怎么做 var usercontrol UserControl RadDockableObject1 FindContro
ffmpeg 保留原始文件日期吗？

我在Win7中使用这个批处理来截断一堆mp4文件的前6秒创建新文件它工作得很好但输出文件的日期是新的如何保留原始日期但我不想重新编码 mp4 文件因为它们太多了太慢了感谢任何回应对于 mp4 中的 a 执行 ffmpeg
MongoDB $regex 查询和潜在的漏洞

我们有一个 REST API 用于查询 MongoDB 中的记录非常简单大致如下 GET api items q foo 在开发过程中允许正则表达式作为查询很方便q 我们只需将查询参数传递给 MongoDB regex运算符并且不进行
为什么每个 Chrome 应用程序窗口都会打开一个新的开发者工具窗口？

从这个问题继续如何在同一 Chrome 应用程序的多个窗口之间进行通信 https stackoverflow com questions 20765870 how to communicate between multiple wind
在 Struts 2 中使 ${} 运算符 XSS 安全（与 Tapestry 相同）

正如中提到的http www disasterarea co uk blog xss vulnerability in web frameworks 2 http www disasterarea co uk blog xss vulner
SLURM sacct 显示“batch”和“extern”作业名称

我已将作业提交到 SLURM 队列该作业已运行并完成然后我使用以下命令检查已完成的作业sacct命令但是查看 sacct 命令的结果我注意到了我没有预料到的其他结果 JobID JobName State NCPUS Timelim
从 ContentBinding 获取视图中的内容

我在使用新的 Ember js 1 0 之前时遇到问题我得到了一些在 Ember 0 9 8 上有效的东西但是当我更改这个库的版本时我注意到无法解决的问题我不太擅长 Ember 这是示例代码 http jsfiddle net E
Symfony2 中基于约定的路由

我正在尝试学习 Symfony2 中的路由是如何工作的到目前为止我读过的所有内容都有这样的例子 blog path blog page defaults controller AcmeBlogBundle Blog index page
Python 打字：TypedDict 是否允许附加/额外的键？

Does typing TypedDict允许额外的钥匙吗如果某个值具有 TypedDict 定义中不存在的键该值是否会通过类型检查器这取决于 PEP 589 规范TypedDict https peps python org pep
文件支持的内存映射的 CPU 缓存行为/策略？

有谁知道哪种类型的CPU缓存行为或策略例如不可缓存的写组合被分配给内存映射文件支持现代 x86 系统上的区域有什么方法可以检测是哪种情况并可能覆盖默认行为吗 Windows 和 Linux 是人们感兴趣的主要操作系统编者注这个问
将 Java 对象转换为 Json，反之亦然？

我知道 JSON 对象只不过是String 我的问题是我有一个对象映射我想将其转换为 Json 格式例子 Java Class gt Class Person private String name private String pas
“覆盖”子类中共享成员的方法

目前我正在尝试在 vb net 中创建一种模型可用于创建获取数据库条目我创建了一个带有共享函数的主类模型来获取数据集例如模型 find 现在我想创建继承主模型类的类例如为用户提供单独的一个 UserModel find gt SE
如何停止 js 插件在页面加载时运行。我只想修复 Ajax 请求

我在用着jquery 节奏插件 https github com HubSpot pace使用进度条主题一切正常但我想仅在 ajax 请求时修复此运行经过大量搜索后我决定在那里发帖希望有人能提供解决方案目前它在 Ajax 和页面
如何以编程方式动态管理 iptables 规则？

我需要查询现有规则以及能够轻松添加和删除规则我还没有找到任何 API 来执行此操作我缺少什么吗我最接近的解决方案是使用iptables save iptables xml用于查询并手动调用 iptables 命令本身来添加删除规则
Google Compute Engine - 使用启动脚本启动 tmux

我试图在启动过程中使用元数据键 startup script 启动 tmux 我正在尝试执行tmux new session d s toto在启动期间但是当我执行tmux ls之后我没有看到任何 tmux 会话我在这里缺少什么您可能
如何在 Keras 中故意过度拟合卷积神经网络以确保模型正常工作？

我正在尝试诊断训练模型时导致精度低的原因此时我只想能够获得高训练精度我可以稍后担心测试精度过度拟合问题如何调整模型以提高训练准确性我想这样做是为了确保我在预处理步骤洗牌分割标准化等中没有犯任何错误 PARAMS drop

如何在 Keras 中故意过度拟合卷积神经网络以确保模型正常工作？

如何在 Keras 中故意过度拟合卷积神经网络以确保模型正常工作？ 的相关文章

随机推荐

热门标签

如何在 Keras 中故意过度拟合卷积神经网络以确保模型正常工作？的相关文章