在训练期间评估模型会影响其性能 PyTorch

2024-02-14

In PyTorch，我想在验证集上评估我的模型eval_step在训练期间，我写了这样的代码：

def tune(model, loader_train, loader_dev, optimizer, epochs, eval_step):
    for epoch in range(epochs):
        for step,x in enumerate(loader_train):
            optimizer.zero_grad()
            loss = model(x)
            loss.backward()
            optimizer.step()
            
            if step % eval_step == 0:
                model.eval()
                test(model, loader_dev)
                model.train()

When eval_step = int(len(loader_train)/2) and eval_step = int(len(loader_train)/8)，它们导致完全不同的度量结果经过一整轮训练后（这意味着前者的第二个输出与后者的第八个输出不同）。

有人能解释一下为什么吗？

长度为loader_train是 20000 （这取决于批量大小），这是我的测试脚本：

def test(model, loader_dev):
    preds = []
    labels = []
    for step,x in enumerate(loader_dev):
        preds.append(model(x).view(-1))
        labels.apend(x['label'].view(-1))

    metric = cal_metric(preds, labels)
    logger.info(metric)

我认为您可能在数据加载器中设置了“shffule=True”。即使您修复了“随机种子”，如果您在使用当前数据加载器时使用另一个数据加载器，torch 中的数据加载器也会生成不同的结果。在您描述的场景中，它可能会导致您的模型以不同的顺序获取数据输入，然后导致不同的指标结果。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Pytorch

在训练期间评估模型会影响其性能 PyTorch 的相关文章

如何下载 NLTK 数据？

更新的答案 NLTK 适用于 2 7 我有3 2 我卸载了3 2并安装了2 7 现在可以了我已经安装了 NLTK 并尝试下载 NLTK 数据我所做的是按照该网站上的说明进行操作 http www nltk org data html h
C++ OpenCV 2.3 中缺少 MoveWindow()

我正在使用 OpenCV 2 3 的 C 版本并且正在努力完成一项基本任务我想做的是创建一个窗口并将其移动到屏幕上的特定位置例如使用 cv namedWindow My Window 1 cv MoveWindow My Window
如何让 pyautogui click 在 mac 上运行？

pyautogui点击方法问题我正在从 Spyder 运行脚本如果我单击 Spyder 窗口上的任何内容则单击效果很好如果我执行脚本打开 Outlook 然后单击任何内容则不会发生单击虽然我能够正确使用 moveTo 功能我按
如何在 Python 中使用 Selenium 运行无头 Chrome？

我正在尝试使用 selenium 进行一些操作我真的希望我的脚本能够快速运行我认为使用无头 Chrome 运行我的脚本会使其速度更快首先这个假设是否正确或者我是否使用无头驱动程序运行我的脚本并不重要我希望无头 Chrome 能够
如何在多个端口上运行 FastAPI 应用程序？

我有一个 FastAPI 应用程序正在使用 Uvicorn 以编程方式在端口 30000 上运行现在我也想在端口 8443 上运行相同的应用程序相同的应用程序需要在这两个端口上运行我怎样才能在Python代码中做到这一点最小可重现
在 Python 3.5 64 位上通过 pip 安装 OpenCV

我尝试安装 OpenCV 但找不到任何合适的 pip 软件包我决定上网查找有关如何安装它的官方文档并发现this https opencv python tutroals readthedocs io en latest py tuto
Google PubSub 在阻止和等待消息时没有标准输出

我正在使用这个问题底部的 Python 代码监听 Google PubSub 消息它实际上是来自 Google 的异步拉取示例我运行我的程序并输出到文件 python my script py tee log txt 如果我在接收消息时
Python pandas cumsum() 在达到最大值后重置

我有一个 pandas DataFrame 其中 timedeltas 作为这些增量的累积和在单独的列中以毫秒表示下面提供了一个示例 Transaction ID Time TimeDelta CumSum ms 1 00 00 04
如何使用生成器遍历文件系统？

我正在尝试创建一个实用程序类来遍历目录中的所有文件包括子目录和子子目录中的文件我尝试使用发电机因为发电机很酷然而我遇到了困难 def grab files directory for name in os listdir dire
scikit-learn - 具有置信区间的 ROC 曲线

我可以使用 ROC 曲线scikit learn with fpr tpr thresholds metrics roc curve y true y pred pos label 1 where y true是基于我的黄金标准的值列表即
UserDict 类的优点？

使用有什么好处UserDict class 我的意思是我真正得到的不是 class MyClass object def init self self a 0 self b 0 m MyClass m a 5 m b 7 我将写下以下内容
Apache2 mod_wsgi 403 禁止错误

我已经正确配置了它但后来我决定重新安装我的 Debian 顺便从 wheezy 切换到 jessie 版本问题是这样的我有一个 python mod wsgi 应用程序 mnt doc Python www index py ls l
Pandas 多索引数据框删除行

我的多索引 DF 如下 tuples list zip a a b b c d c d index pd MultiIndex from tuples tuples names i1 i2 df pd DataFrame 5 6 7 8 i
在 Python 中删除表达式树及其每个子表达式树中第一个元素周围的括号

目标是实现简化操作删除表达式树及其每个子表达式树中第一个元素周围的括号其中表达式作为括在各个括号中的字符串输入给出这必须适用于任意数量的括号例如 12 3 45 6 gt 123 45 6 删除 12 周围的括号然后删除 45 周
带日志图的 Type 1 字体

我正在尝试使用 Matplotlib 图表作为相机就绪的一部分提交出版社要求使用Type 1字体仅有的我发现 PDF 后端很乐意输出 Type 1 字体具有线性 Y 轴的简单图形但输出 Type 3 字体对数 Y 轴使用对数
Python Shutil.copy 如果我有重复文件，它会复制到新位置吗

我正在与shutil copypython 中的方法我找到了下面列出的定义 def copyFile src dest try shutil copy src dest eg src and dest are the same file
Django - 在启动时执行代码

我正在使用 Django 1 9 3 我有一个包含多个应用程序的项目我想在项目启动时更新其中一个应用程序的表用例例如假设我想在我的网站上销售商品我有一个包含模型项目的应用程序我在 Django 之外有一个网络服务它提供服务 g
Mac OS X 上的 Python 框架和非框架构建之间的差异

Question Mac OS X 上的 Python 框架构建和非框架构建即标准 UNIX 构建之间有什么区别另外各自的优点和缺点是什么初步研究以下是我在发布此问题之前找到的信息 Pythonmac SIG Why is Fr
将下载的字体添加到 Tkinter

我想下载一个开源字体并在我的 Python Tkinter 程序中使用它如何告诉 Tkinter 从目录导入字体或将字体放在与程序相同的文件夹中 Note 我已经寻找答案一段时间了甚至阅读了 Tkinter 的 API 参考了解我能找
使用按钮从 Django 项目根下载文件

So this is the webpage I m creating atm with Django 1 8 希望用户能够将数据导出为 csv 当用户在框中写下 Reddit 子版块名称按下获取数据按钮会发生什么它创建了一个

随机推荐

“目录名称无效。”等等，在Windows上使用rabbitmq-plugins

我正在尝试通过以下方式让 RabbitMQ 在 Windows 10 上运行这些说明 http arcware net installing rabbitmq on windows 但是当尝试通过 powershell 命令启用管理插件时
使用 vue.js 获取调用元素

我想获取 vue js 中调用 html 元素以通过 jQuery 修改它现在我为每个元素指定类名索引然后通过 jQuery 调用它但这看起来像是一个疯狂的 hack 我想做的事 new Vue el app data testF
为什么中序和前序遍历对于创建算法来确定 T2 是否是 T1 的子树很有用

我正在看一本采访书问题是你有两个非常大的二叉树 T1 拥有数百万个节点并且T2 有数百个节点创建一个算法来决定是否T2是一个的子树T1 作者提到这是一个可能的解决方案请注意这里的问题指定T1有数百万节点这意味着我们应该注意
无法从 NGINX 获取包含句点的标头

标题 Abp TenantId is null因为如果删除 like AbpTenantId 一切都会安好的如何添加标题 localhost debug 显示临时标头根据客户请求显示 Request Headers Unknown 在
Material UI 网格列表行有一个很大的尴尬间隙

我正在使用 Material UI 和 Reactjs 我对网格列表组件有疑问我尝试使用网格 1000x1000px 因此我将自定义 gridList 样式中的高度和宽度分别指定为 1000 和 1000 如文档中所示应有 10 列每
在多个节点上运行kafka connect分布式模式

我正在测试一个卡夫卡连接器的弹性我想在它运行时杀死一个工作人员从而杀死连接器实例最简单的方法可能是强制分布式模式在多个节点上运行然后终止该节点上的工作进程对吗如何使 Kafka 将生成工作程序连接到不仅仅是其启动的节点上这是在
如何调试 Mac OS X 上的互斥锁问题？

我正在尝试让 gdb lldb 存根为我正在制作的程序工作现在它似乎使调试器陷入僵局所以我讽刺的是在我的机器上调试 lldb 以尝试找出问题所在 lldb 正在尝试锁定互斥体并且似乎陷入僵局在 Windows 上我知道你可以使
java连接到sql server 2008express

我尝试连接到我的 BD 这是我的代码 public class JavaSQLTest param args the command line arguments public static void main String args tr
运行scala代码jar出现NoSuchMethodError:scala.Predef$.refArrayOps

我的代码在idea中通过本地模式可以正常运行当我打印成jar包上传到我部署的SPARK服务器上运行时出现NoSuchMethodError scala 预定义 refArrayOps 出现了出错的那行代码如下val expectArr
单元测试应该涵盖压力测试吗？

我想知道你们是否有任何好的读物来考虑将什么分类为单元测试验收集成测试我有以下场景我们在工作中就是否应该在单元测试中进行了一些辩论在我们的数据访问层有些语句使用了sql比如 select from people where id
使用 C# 发送 Outlook 会议请求

我希望从 C 发送 Outlook 会议请求我有下面的代码它可以完成这项工作但是 string startTime1 Convert ToDateTime startTime ToString yyyyMMddTHHmmssZ str
方法调用可能会产生 java NullpointerException

我有一个代码 public String getNameUpdateEvent long id Cursor mCursor db rawQuery select name from events WHERE id id null if m
带模板参数的 C++ 函数调度

我正在重构一个大类我们称之为Big 有大量的复制粘贴代码大部分复制粘贴代码存在于switch case只有涉及的类型最终不同该代码是基于一个切换enum类的成员变量其值仅在运行时才知道我尝试解决这个问题需要有一个Dispatche
Azure Pipelines DotNetCoreCLI - .Net Core SDK 生命周期结束

我在 Azure CI 管道中收到错误尝试运行 DotNetCoreCLI 时restore task 已经报废了几个小时的网络无济于事相关问题没有解决方案可以帮助我理解问题基本上我们已经在存储库中添加了一个新项目该项目需要运行
大整数的按位运算

我正在实现 BER 压缩整数的解码最近我发现了与大整数按位运算相关的奇怪 JavaScript 行为 E g var a 17516032 has 25 bits alert a lt lt 7 outputs 2052915200 al
哪些 x86 C++ 编译器本身是多线程的？

现在几乎每个用户在台式机上以及大量笔记本电脑上都拥有 2 或 4 个核心高级用户拥有 6 12 个 AMD 或 i7 核心哪些 x86 x86 64 C C 编译器可以使用多个线程进行编译已经有一个 make j N 类似的解决
我使用的是哪个版本的 python time 模块

如何确定安装了哪个版本的 python 模块 time 对于其他模块 version version or version 工作但是时间上这两种方法都会返回错误模块对象没有属性 version 或版本 Module time内置于
Google Analytics Regex - 无负向前瞻的替代方案

Google Analytics 分析在其过滤器中不再允许负向前瞻事实证明创建仅包含我希望包含的链接的自定义报告非常困难包含负向前瞻的正则表达式在启用时可以工作 test com index php s 这匹配 test com t
聚合 MongoDB 中子文档的总计

我有一个如下所示的文档我本质上想为子文档中的项目生成一个聚合本质上每个文档都是一个销售记录其中包含销售详细信息和包含每个商品销售数量的子文档数组我想生成所有已售商品的摘要因此一个示例集合是 non relevant 1 AB
在训练期间评估模型会影响其性能 PyTorch

In PyTorch 我想在验证集上评估我的模型eval step在训练期间我写了这样的代码 def tune model loader train loader dev optimizer epochs eval step for ep

在训练期间评估模型会影响其性能 PyTorch

在训练期间评估模型会影响其性能 PyTorch 的相关文章

随机推荐

热门标签