pytorch计算模型参数量报错：size mismatch for module.conv1.weight: copying a param with shape torch.Size([16, 3

2023-10-28

错误：

RuntimeError: Error(s) in loading state_dict for DataParallel:
	size mismatch for module.conv1.weight: copying a param with shape torch.Size([16, 3, 3, 3]) from checkpoint, the shape in current model is torch.Size([128, 128, 3, 3]).
	size mismatch for module.bn1.weight: copying a param with shape torch.Size([16]) from checkpoint, the shape in current model is torch.Size([128]).
	size mismatch for module.bn1.bias: copying a param with shape torch.Size([16]) from checkpoint, the shape in current model is torch.Size([128]).
	size mismatch for module.bn1.running_mean: copying a param with shape torch.Size([16]) from checkpoint, the shape in current model is torch.Size([128]).
	size mismatch for module.bn1.running_var: copying a param with shape torch.Size([16]) from checkpoint, the shape in current model is torch.Size([128]).
	size mismatch for module.bn2.weight: copying a param with shape torch.Size([64]) from checkpoint, the shape in current model is torch.Size([256]).
	size mismatch for module.bn2.bias: copying a param with shape torch.Size([64]) from checkpoint, the shape in current model is torch.Size([256]).
	size mismatch for module.bn2.running_mean: copying a param with shape torch.Size([64]) from checkpoint, the shape in current model is torch.Size([256]).
	size mismatch for module.bn2.running_var: copying a param with shape torch.Size([64]) from checkpoint, the shape in current model is torch.Size([256]).

解决方案：

在加载模型时加上上面这句话，因为是多GPU训练出来的模型。

model = nn.DataParallel(model).cuda()
model.load_state_dict(torch.load("C:\\Users\\83543\\Desktop\\model_best.pth.tar")['state_dict'],False)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

torch

pytorch计算模型参数量报错：size mismatch for module.conv1.weight: copying a param with shape torch.Size([16, 3 的相关文章

正确使用cocoaPods 在OC中集成Charts第三方库

之前的看到的都是错误的正确的步骤如下 1 安装cocoaPods 2 新建一个OC工程 3 pod init 到 vi Podfile Uncomment the next line to define a global platform

随机推荐

MySQL主从、集群模式简单介绍

目录 1 主从模式 Replication 2 集群模式 3 主从模式部署注意事项主从模式集群模式都是在一个项目中使用多个mysql节点进行存储和读取数据当单机模式部署不满足安全性高可用高并发等需求的时候就需要考虑主从模式或
超详细的Git使用教程(图文)

一 Git概述 1 1 Git历史 Git 诞生于一个极富纷争大举创新的年代 Linux 内核开源项目有着为数众多的参与者绝大多数的 Linux 内核维护工作都花在了提交补丁和保存归档的繁琐事务上 1991 2002年间到 2002 年
leecode-寻找重复数字

题目题目分析哇哦原来vector可以这样初始化学到了不初始化会直接报错嘞代码 class Solution public int findDuplicate vector
企业微信使用高德地图获取定位报错：INVALID_USER_SCODE（无效用户代码）

解决方案 1 在html头部放你创建的高德安全密钥 2 完整代码如下
JAVA高级知识点整理

提示文章写完后目录可以自动生成如何生成可参考右边的帮助文档文章目录前言 String字符串类 String 可变字符串 StringBuilder 可变字符串与String之间的转换 RunTime类概述特点使用 Data类
apache beam入门之程序入口——PipelineOption

前置章节apache beam入门宝典之初次使用从第一章里我们看到最开始需要生成1个PipelineOption 然后才能生成1个Pipeline 而这个所谓的option用处是将可以将程序输入的args数组转成1个PipelineOpt
【基于python实现UI自动化】3.0 selenium - webdriver常见8大元素定位

python UI自动化之selenium元素定位 1 0 selenium工具介绍 2 0 selenium环境搭建 3 0 selenium元素定位 selenium常见8大元素定位通过ID定位通过class name定位通过na
[开发过程]＜c#上位机＞关于.net6

水下机器人 c 上位机根据官方文档进行学习开发 1 了解 net6 简而言之就是稳定强悍跨设备简单上手资源丰富强 Announcing NET 6 The Fastest NET Yet NET Blog NET 6 is no
java类的参考文献，太完整了！

一面先是问了问项目然后就开始问一些问题 1 每个请求耗时100ms 机器的配置是4核8G 问要达到10000TPS需要多少台机器没答上来问了问是IO密集型还是CPU密集型然后面试官说我想得太复杂了 2 怎么实现网页的自动跳转答3
将json文件解析存储到MySQL数据库

PostMapping test public Object test RequestParam file MultipartFile file 将JSON解析为Java对象也称为从JSON反序列化Java对象 ObjectMapper o
Spring Cloud 2.x之整合工作流Activiti

工作流在项目中非常常用这里先来看两张图第一张第二张对以上两张图进行说明假设这两张图就是华谊兄弟的请假流程图图的组成部分人物范冰冰冯小刚王中军事件动作请假批准不批准工作流 Workflow 就是业务过程的部分
LLVM 环境搭建

LLVM相关环境搭建 PC VMware Workstation 下载 https www vmware com go getworkstation win KEY ZC3WK AFXEK 488JP A7MQX XL8YF 可自行网上查
Vue中使用qrcode实现渲染生成二维码中间添加自定义logo-demo

效果安装 npm i qrcode 使用 import QRCode from qrcode 具体生成过程
Mac OS X下Maven的安装与配置

Mac OS X 安装Maven 下载 Maven 并解压到某个目录例如 Users robbie apache maven 3 3 3 打开Terminal 输入以下命令设置Maven classpath vi bash profil
小程序打开速度慢是服务器原因吗,网页打开速度慢的原因以及解决方法

现在大多数企业都会选择做自己的官方网站网站的作用更像一张互联网上的企业名片客户能否选择你在于网站的质量网站质量的好与坏主要取决于网站的流量而影响网站流量最核心的因素就是网站打开速度那么今天就来给大家分享一下网页打开速度慢的原
CTFHUB-布尔盲注

布尔盲注页面回显的结果只有两种 true 和 false true false 常用函数 count x 返回统计的数量 length str 返回str字符串的长度 ascii str 返回字符串str的最左面字符的ASCII代码值 s
vue3-实战-06-管理后台-品牌管理模块开发

目录 1 品牌列表 1 1 需求图 1 2 定义接口和数据类型 1 3 请求接口和渲染数据 2 新增和修改品牌 2 1 需求原型分析 2 2 dialog开发 2 3 请求接口封装 2 4 图片上传组件开发 2 5 新增修改品牌信息 3
pb中计算两个时间的分钟_利用Power BI中的两个函数，灵活计算各种占比！

计算个体占总体的比例是一个很常见的分析方式它很简单就是两个数字相除但是当需要计算的维度总体的范围发生动态变化时如何灵活且快速的计算出各种占比还是需要动一点心思的本文就通过 DAX 中的 ALL 和 ALLSELECTED 函数
Qt中的信号和信号槽（一）

目录 1 信号和槽概述信号和槽的关系 2 标准信号槽使用标准信号槽示例 3 自定义信号槽使用自定义信号自定义槽示例 1 信号和槽概述信号和槽是一种事件驱动的通信机制广泛应用于Qt框架的事件处理 GUI编程网络通信等方面
pytorch计算模型参数量报错：size mismatch for module.conv1.weight: copying a param with shape torch.Size([16, 3

错误 RuntimeError Error s in loading state dict for DataParallel size mismatch for module conv1 weight copying a param wit

pytorch计算模型参数量报错：size mismatch for module.conv1.weight: copying a param with shape torch.Size([16, 3

错误：

解决方案：

pytorch计算模型参数量报错：size mismatch for module.conv1.weight: copying a param with shape torch.Size([16, 3 的相关文章

随机推荐

热门标签