模型参数加载后继续训练或测试，准确率下降很多或者一直不变

2023-10-29

1、请首先检查自己是不是没有将原来的模型参数成功导入

你以为你导入成功了，但是注意，你load_state_dict时，如果用了strict=False是不会报错的，所以如果你没有仔细核对参数名是否正确（主要针对有使用预训练模型参数的情况，这时参数名称容易与你的模型有出入）
仔细检查自己的模型是不是按checkpoint['net']格式存储的，如果是，你直接导入checkpoint肯定不行啊

2、如果训练时一直不变，注意应该加载模型参数前就定义优化器

参考【python模型保存之后，再恢复训练如何做】_权侑莉老婆的博客-CSDN博客

3、加载后准确率很低，尤其是测试验证集准确率时准确率都很低，多半是因为标签问题。

先要检查自己的标签是否是固定的，可能会出现两次训练标签不一致的情况。

4、想要继续训练时，完全与之前保持相同的走势，需要加载优化器参数、步长scheduler、epoch，可参考PyTorch实现断点继续训练 - 知乎

5、构造optim对象时可以先做好模型的cuda()操作（这个我认为不一定，但是可以参考）

Pytorch 深度学习模型训练断点继续训练时损失函数恶化或与断点差异较大_周博士的博客-CSDN博客

6、测试图片时记得把模型调成eval()模型

7、如果要放到多gpu上训练，使用torch.nn.parallel.DistributedDataParallel前一定要加载好模型参数，（因为DDP后模型参数都加上了modules，这样加载参数时如果使用strict=False就自动没有加载了）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

人工智能

深度学习

Pytorch

模型参数加载后继续训练或测试，准确率下降很多或者一直不变的相关文章

用户警告：MovieWriter ffmpeg 不可用

尝试在 google colab 上制作动画收到此警告用户警告 MovieWriter ffmpeg 不可用 warnings warn MovieWriter s 不可用 writer did pip 安装 ffmpeg 标准化但没有
使用 pycharm 进行交互式 shell 调试

我是 PyCharm 新手我已经使用 IDLE 很长时间了在IDLE中执行脚本后使用Python对象非常方便有没有办法在使用 PyCharm 与交互式 python shell 执行后使用脚本对象例如我们有一个测试项目其中包
如何在基于其他数据帧的数据帧中创建联接？

我有 2 个数据框一份包含学生批次详细信息另一份包含分数我想加入 2 个数据框数据框1包含 s1 s2 s3 Stud1 Stud2 Stud3 Stud2 Stud4 Stud1 Stud1 Stud3 Stud4 数据框2包含
使用 Python pdb 检查未处理异常原因的最简单方法是什么？

我刚刚将所有单元测试数据从 JSON 转换为 YAML 现在代码中的某处引发了异常更具体地说这是打印的回溯 Traceback most recent call last File tests test addrtools py lin
根据日期列过滤并创建列

我有一个样本数据如下 date Deadline 2018 08 01 2018 08 11 2018 09 18 2018 12 08 2018 12 18 我想用代码中描述的条件填写截止日期列如 1 DL 2 DL 3 DL 等基于
表单输入框不显示

我正在尝试使用 Django 显示一个简单的表单输入文本框我正在亚马逊 AWS 上部署该网站在不同的服务器 pythonanywhere 上运行良好但在 AWS 上存在主要问题具体来说输入框没有被显示我使用的模板如下首页 ht
AttributeError：模块“tensorflow.python.summary.summary”没有属性“FileWriter”

我收到此错误尽管我到处都看过file writer tf summary FileWriter path to logs sess graph 被提到为正确的实施this https github com tensorflow tenso
根据另一个非索引数组中的值从 numpy 数组中选择元素

假设我有以下两个数组 a array 1 L 74 423088306605 5 H 128 05441039929008 2 L 68 0581377353869 0 H 88 15726964130869 4 L 97 45015825
确定列的累积最大值

我正在尝试以下代码 df pd DataFrame 23 52 36 49 52 61 75 82 97 12 columns A B df C np where df A gt df C shift df A df C shift pri
使用 Numpy 与 einsum 和 tensordot 进行相同的操作

假设我有两个 3D 数组A and B形状的 3 4 N and 4 3 N 我可以计算沿第三轴的切片之间的点积 with einsum np eisum ikl kjl gt ijl A B 是否可以执行相同的操作numpy tensor
Dataframe unstack 性能 - pandas

我正在尝试拆开数据框它工作正常但问题是我正在处理 CSV 文件中的巨大数据集约 10 亿这是示例数据集 236539 48512569874 Name Danny 236539 48512569874 Class 12 236539
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
如何将 MP3 音频文件读入 numpy 数组/将 numpy 数组保存到 MP3？

有没有办法从 MP3 音频文件中读取写入 MP3 音频文件numpy具有类似 API 的数组scipy io wavfile read https docs scipy org doc scipy 0 14 0 reference gen
为什么Python安装程序不断弹出？

每当我尝试运行 Python 文件时都会自动弹出此窗口虽然我可以关闭它但有时它会连续打开 7 10 个窗口这令人恼火谁能告诉我为什么会发生这种情况 None
Chrome 已关闭，并出现错误 ERROR:network_change_notifier_win.cc(141)] WSALookupServiceBegin 失败，原因为：0

我的笔记本电脑操作系统是 windows 10 我使用 selenium webdriver 和 Python 当我通过脚本打开chrome浏览器时加载网页后chrome就关闭了下面是我的python代码和错误 from seleniu
Django ImageField 默认值

模型 py class UserProfile models Model photo models ImageField upload to get upload file name storage OverwriteStorage def
从由空格分隔的单个输入整数列表创建二维数组

我正在解决一些问题geeksforgeeks我遇到了一个特定的问题其中在测试用例中提供了输入如下所示 2 2 denotes row column of the matrix 1 0 0 0 all the elements of th
如何提高大规模数据帧上 lambda 函数的性能

我有一个df超过数亿行 latitude longitude time VAL 0 39 20000076293945312500 140 80000305175781250000 1972 01 19 13 00 00 1 2000000
python 根据日期创建目录结构

我使用以下函数根据今天的日期创建目录 usr bin python import time datetime os today datetime date today todaystr today isoformat os mkdir to
Python google云函数部署失败-Madmom pip包

我正在尝试使用 madmom python pip 包部署 Python3 7 Google Cloud Function 但是指定madmom 0 16 1requirements txt 中的内容导致部署失败当我从requiremen

随机推荐

【Qt笔记】[帮助文档]——类QString：取子串函数mid()、left()、right() ——QT怎么取字符串子串切片

mid 函数原型 QString QString mid int position int n 1 const 返回一个从position开始长度为n的QString 类型的子串当position的下标值超出字符串长度时返回null
[1165]python量化交易包talib安装方法

首先你要明确你的系统版本 win32系统还是Linux X86还是X64 如果你的系统是x86平台在安装了anaconda 的基础上可以直接使用pip安装命令如下 pip install talib 如果你的系统是x64平台直接使用
结构型设计模式之享元模式（Flyweight）

在面向对象程序设计过程中有时会面临要创建大量相同或相似对象实例的问题创建那么多的对象将会耗费很多的系统资源它是系统性能提高的一个瓶颈例如围棋和五子棋中的黑白棋子图像中的坐标点或颜色局域网中的路由器交换机和集线器教室里的桌子
ChatGPT 用C++实现windows 应用配置文件权限设置

问我有一个windows 应用程序应用程序中有个配置文件 config txt 现在我不想让其他任何应用程序对config txt有修改删除的操作权限请你用c 语言输出 1 对config txt文件的权限设置和权限解除 2 对解除
GLib-GObject-CRITICAL **: g_object_unref: assertion 'G_IS_OBJECT (object)' failed分析

在调试opencv程序的时候对于新手来说会有很多令人恶心的错误这些错误编译器可能检查不出来但是程序却运行不了例如 pic 6130 GLib GObject CRITICAL g object unref assertion G
ROI是什么？电商ROI计算公式及理论及详解

跟大家谈一谈电商ROI理论及计算公式图片来源 123rf com cn 支付收款 23年互联网上市公司境内外牌照认证优惠力度大最快1秒到账点此查看 gt gt ROI是什么相信刚接触电商的外贸商家乍一听这个词会感觉一头雾水找了各
读取数据并可视化——seaborn

读取数据并可视化 seaborn 一语法 DataFrame plot 函数 scatterplot参数 seaborn scatterplot x None y None hue None style None size None da
Jupyter Notebook安装和使用详情(你不懂我......)

一 Jupyter Notebook是什么 1 notebook jupyter 简介 Jupyter Notebook是一个开源Web应用程序允许您创建和共享包含实时代码方程式可视化效果和叙述文本的文档用途包括数据清理和转换数
用React做一个音乐播放器

介绍任何正在学习 React 并想使用 React 构建项目的人有各种博客和文章可以为开发人员指导此类项目我确实浏览过这些文章但其中总是缺少一种项目缺少的项目是音乐播放器和视频播放器这两个项目都会让您有机会处理音频和视频您将学
doris操作相关

错误 Key columns should be a ordered prefix of the schema 解决建表时UNIQUE KEY必须放在所有字段前面声明且保证有序示例 drop TABLE vhc data models
N个任务，分配给M个人，那么每个人得到的任务数量----总结经验

1 每个人得到的任务数量 N M 2 最后一个人的任务加上 N M 转载于 https www cnblogs com duwenlei p 3682517 html
安装batocera-linux教程_利用Grub2Win安装Batocera+Windows7双系统甚至多系统实战教程

这里以安装Batocera PLUS到C盘也就是windows所在的分区示例你也可以选择安装到其他盘本教程之适用于MBR启动不适用于UEFI 用到的工具和文件 DISKGENIUS或者其他分区软件 Grub2Win Notepad 或
python调用通达信函数_mootdx: 通达信数据读取 pytdx 的一个简便使用封装

通达信数据读取接口版本更新修正转债数据无法获取问题修改获取股票数据接口自动全部获取修改指数数据接口市场参数错误修复财务数据无法下载问题更新了详细的文档多种线路配置方案配置文件环境变量等重写了专业财务数据接口更新了最
(00)Hi3516A/Hi3516D SDK 安装以及升级使用说明

Hi3516A Hi3516D SDK 安装以及升级使用说明注意本文以Hi3516A描述为例未有特殊说明 Hi3516D与Hi3516A一致第一章 Hi3516A SDK Vx x x x版本升级操作说明如果您是首次安装本SDK
一站式讲明白Mockito打桩测试常用的几个接口

一站式讲明白Mockito打桩测试常用的几个接口文章目录一站式讲明白Mockito打桩测试常用的几个接口 1 几个术语 2 Mock对象和Mock部分对象 partial mock 场景接口实例 3 否真正执行方法 doXxx和th
webpack5 打包工具详解

webpack 详解 1 webpack是什么 2 webpack初始化配置 3 webpack 开发环境的基本配置 3 1 webpack配置打包 3 2 webpack css 样式打包 3 3 webpack Html资源打包 3 4
Butterfly 最新评论 newest-comments 401/资源加载错误（无法获取资料，请确认相关配置是否正确）

集成 Butterfly 博客主题中在配置最新评论 newest comments 时根据 Butterfly 的配置文档配置完成后最新评论一直无法显示提示错误信息无法获取资料请确认相关配置是否正确在网页调试模式下给出的错误
Java面向对象学习笔记（四）常用集合

Java面向对象学习笔记四常用集合 Java集合 1 Collection 1 List 1 ArrayList 2 Vector 2 Set 1 HashSet 2 LinkedHashSet 2 Map 1 HashMap 3 C
ajax中sy,黑马eesy_15 Vue：vue语法和生命周期与ajax异步请求

自学Java后端开发发现14 微服务电商乐优商城实战项目在介绍完SpringCloud后就要肝前端的基础知识ES6语法和Vue js 所以本篇博客作为入门Vue练习记录的过程目的是供自学后端Java遇到Vue使用需求的时候加强学
模型参数加载后继续训练或测试，准确率下降很多或者一直不变

1 请首先检查自己是不是没有将原来的模型参数成功导入你以为你导入成功了但是注意你load state dict时如果用了strict False是不会报错的所以如果你没有仔细核对参数名是否正确主要针对有使用预训练模型参数的情况

模型参数加载后继续训练或测试，准确率下降很多或者一直不变

模型参数加载后继续训练或测试，准确率下降很多或者一直不变 的相关文章

随机推荐

热门标签

模型参数加载后继续训练或测试，准确率下降很多或者一直不变的相关文章