RuntimeError: Expected 4-dimensional input for 4-dimensional weight [32, 1, 5, 5]

2023-05-16

文章目录

1. 问题引入
2. 运行报错
3. 代码
4. 分析原因
5.解决办法
6. 完整代码
7. 参考文献

1. 问题引入

今天在使用pytorch训练一个模型的，数据集的读取是使用pytorch自带的函数来进行读取和预处理的，网络使用的是自定义的CNN，然后在运行的时候出现了如标题所示的这种小错误。

2. 运行报错

如下所示：

RuntimeError: Expected 4-dimensional input for 4-dimensional weight [32, 1, 5, 5], but got 2-dimensional input of size [32, 784] instead

3. 代码

首先是我自己自定义的CNN网络如下所示：

class MNIST_Model(nn.Module):
    def __init__(self, n_in):
        super(MNIST_Model, self).__init__()

        self.conv1 = nn.Sequential(
            nn.Conv2d(in_channels=n_in,
                      out_channels=32,
                      kernel_size=(5, 5),
                      padding=2,
                      stride=1),
        )

        self.maxp1 = nn.MaxPool2d(
                       kernel_size=(2, 2))

        self.conv2 = nn.Sequential(
            nn.Conv2d(in_channels=32,
                      out_channels=64,
                      kernel_size=(5, 5),
                      padding=0,
                      stride=1),
        )

        self.maxp2 = nn.MaxPool2d(kernel_size=(2, 2))
        
        self.fc1 = nn.Sequential(
            nn.Linear(in_features=64 * 5 * 5, out_features=200)  # Mnist
        )

        self.fc2 = nn.Sequential(
            nn.Linear(in_features=200, out_features=10),
            nn.ReLU()
        )


    def forward(self, x):
        x = self.conv1(x)
        x = self.maxp1(x)
        x = self.conv2(x)
        x = self.maxp2(x)
        x = x.contiguous().view(x.size(0), -1)
        x = self.fc1(x)
        x = self.fc2(x)
        return x

然后是在训练模型的代码

#实例化网络，只考虑使用CPU
model = model.MNIST_Model(1)
net = model.to(device)
#定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
#momentum:动量因子有什么用处？
optimizer = optim.SGD(model.parameters(),lr=lr,momentum=momentum)


#开始训练 先定义存储损失函数和准确率的数组
losses = []
acces = []
#测试用
eval_losses = []
eval_acces = []

for epoch in range(nums_epoches):
    #每次训练先清零
    train_loss = 0
    train_acc = 0
    #将模型设置为训练模式
    model.train()
    #动态学习率
    if epoch%5 == 0:
        optimizer.param_groups[0]['lr'] *= 0.1
    for img,label in train_loader:
        #前向传播，将图片数据传入模型中
        # out输出10维，分别是各数字的概率，即每个类别的得分
        out = model(img)
        #这里注意参数out是64*10，label是一维的64
        loss = criterion(out,label)
        #反向传播
        #optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0
        optimizer.zero_grad()
        loss.backward()
        #这个方法会更新所有的参数，一旦梯度被如backward()之类的函数计算好后，我们就可以调用这个函数
        optimizer.step()
        
        #记录误差 
        train_loss += loss.item()
        
        #计算分类的准确率,找到概率最大的下标
        _,pred = out.max(1)
        num_correct = (pred == label).sum().item()#记录标签正确的个数
        acc = num_correct/img.shape[0]
        train_acc += acc
    losses.append(train_loss/len(train_loader))
    acces.append(train_acc/len(train_loader))
    
    eval_loss = 0
    eval_acc = 0
    model.eval()
    for img,label in test_loader:
        img = img.view(img.size(0),-1)
        
        out = model(img)
        loss = criterion(out,label)
        
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        eval_loss += loss.item()
        
        _,pred = out.max(1)
        num_correct = (pred == label).sum().item()
        acc = num_correct/img.shape[0]
        eval_acc += acc
    eval_losses.append(eval_loss/len(test_loader))
    eval_acces.append(eval_acc/len(test_loader))
    

    print('epoch:{},Train Loss:{:.4f},Train Acc:{:.4f},Test Loss:{:.4f},Test Acc:{:.4f}'
             .format(epoch,train_loss/len(train_loader),train_acc/len(train_loader),
                    eval_loss/len(test_loader),eval_acc/len(test_loader)))

4. 分析原因

定位出错位置

Traceback (most recent call last):
  File "train.py", line 73, in <module>
    out = model(img)
  File "/home/gzdx/anaconda3/envs/Torch/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/gzdx/wyf/PARAD/model.py", line 48, in forward
    x = self.conv1(x)
  File "/home/gzdx/anaconda3/envs/Torch/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/gzdx/anaconda3/envs/Torch/lib/python3.7/site-packages/torch/nn/modules/container.py", line 119, in forward
    input = module(input)
  File "/home/gzdx/anaconda3/envs/Torch/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl
    result = self.forward(*input, **kwargs)
  File "/home/gzdx/anaconda3/envs/Torch/lib/python3.7/site-packages/torch/nn/modules/conv.py", line 399, in forward
    return self._conv_forward(input, self.weight, self.bias)
  File "/home/gzdx/anaconda3/envs/Torch/lib/python3.7/site-packages/torch/nn/modules/conv.py", line 396, in _conv_forward
    self.padding, self.dilation, self.groups)
RuntimeError: Expected 4-dimensional input for 4-dimensional weight [32, 1, 5, 5], but got 2-dimensional input of size [32, 784] instead

可以看到这句提示，大致就是我们传入的数据输入到CNN网络，然后由于维度不同导致的。因为我们输入的是四维，但是得到的却是二维。

  File "train.py", line 73, in <module>
    out = model(img)

5.解决办法

对于这种问题网上给出了很多中不同的方案，这个哦个人也是参考我网上别人给出的一点想法然后自己修改了下，错误就解决了，如下所示：

for i,data in enumerate(train_loader):
        #前向传播，将图片数据传入模型中
        # out输出10维，分别是各数字的概率，即每个类别的得分
        inputs, labels = data
        inputs,labels = data[0].to(device), data[1].to(device)
        # inputs torch.Size([32, 1, 28, 28])
        out = model(inputs)

解决办法也是很简单，就是将上面训练开始阶段将数据按照这种读取方式来赋值，然后在传入到model里面就不会出现上面那种错误了。

6. 完整代码

import numpy as np
import model
import torch

#导入PyTorch内置的mnist数据
from torchvision.datasets import mnist

#导入预处理模块
from torchvision import transforms
from torch.utils.data import DataLoader

#导入神经网络工具
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

#定义后面要用到的超参数
train_batch_size = 32
test_batch_size = 32

#学习率与训练次数
learning_rate = 0.01
nums_epoches = 50

#优化器的时候使用的参数
lr = 0.1
momentum = 0.5

#用compose来定意预处理函数
transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize([0.5],[0.5])])

#下载数据，在工程文件夹里新建一个data文件夹储存下载的数据
train_dataset = mnist.MNIST('./data', train=True, transform=transform, target_transform=None, download=False)
test_dataset = mnist.MNIST('./data', train=False, transform=transform, target_transform=None, download=False)

#数据加载器，组合数据集和采样器，并在数据集上提供单进程或多进程迭代器
train_loader = DataLoader(train_dataset, batch_size=train_batch_size, shuffle=True, num_workers=0)
test_loader = DataLoader(test_dataset, batch_size=test_batch_size, shuffle=False)

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

#实例化网络，只考虑使用CPU
model = model.MNIST_Model(1)
net = model.to(device)
#定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
#momentum:动量因子有什么用处？
optimizer = optim.SGD(model.parameters(),lr=lr,momentum=momentum)




#开始训练 先定义存储损失函数和准确率的数组
losses = []
acces = []
#测试用
eval_losses = []
eval_acces = []

for epoch in range(nums_epoches):
    #每次训练先清零
    train_loss = 0
    train_acc = 0
    #将模型设置为训练模式
    model.train()

    #动态学习率
    if epoch%5 == 0:
        optimizer.param_groups[0]['lr'] *= 0.1
    for i,data in enumerate(train_loader):
        #前向传播，将图片数据传入模型中
        # out输出10维，分别是各数字的概率，即每个类别的得分
        inputs, labels = data
        inputs,labels = data[0].to(device), data[1].to(device)
        out = model(inputs)
        #这里注意参数out是64*10，label是一维的64
        loss = criterion(out,labels)
        #反向传播
        #optimizer.zero_grad()意思是把梯度置零，也就是把loss关于weight的导数变成0
        optimizer.zero_grad()
        loss.backward()
        #这个方法会更新所有的参数，一旦梯度被如backward()之类的函数计算好后，我们就可以调用这个函数
        optimizer.step()
        
        #记录误差 
        train_loss += loss.item()
        
        #计算分类的准确率,找到概率最大的下标
        _,pred = out.max(1)
        num_correct = (pred == labels).sum().item() #记录标签正确的个数
        acc = num_correct/inputs.shape[0]
        train_acc += acc
    losses.append(train_loss/len(train_loader))
    acces.append(train_acc/len(train_loader))
    print('Finished Training') 

    # 保存模型
    PATH = './model/mnist_net.pth'
    torch.save(net.state_dict(), PATH)
    
    eval_loss = 0
    eval_acc = 0
    model.eval()
    for i,data in enumerate(test_loader):
        inputs, labels = data
        inputs,labels = data[0].to(device), data[1].to(device)
        out = model(inputs)
        loss = criterion(out,labels)
        
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        
        eval_loss += loss.item()
        
        _,pred = out.max(1)
        num_correct = (pred == labels).sum().item()
        acc = num_correct/inputs.shape[0]
        eval_acc += acc
    eval_losses.append(eval_loss/len(test_loader))
    eval_acces.append(eval_acc/len(test_loader))
    

    print('epoch:{},Train Loss:{:.4f},Train Acc:{:.4f},Test Loss:{:.4f},Test Acc:{:.4f}'
             .format(epoch,train_loss/len(train_loader),train_acc/len(train_loader),
                    eval_loss/len(test_loader),eval_acc/len(test_loader)))

7. 参考文献

1.pytorch学习笔记—搭建CNN识别MNIST

2.使用Pytorch框架的CNN网络实现手写数字（MNIST）识别

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

RuntimeError

Expected

dimensional

input

for

RuntimeError: Expected 4-dimensional input for 4-dimensional weight [32, 1, 5, 5] 的相关文章

在 Python 上分析字符串输入直到达到某个字母

我需要帮助来尝试编写程序的某个部分这个想法是一个人输入一堆乱码程序会读取它直到它到达感叹号例如 input Type something 人物类型 wolfdo65gtornado salmontiger223 如果我要求程序打
为什么当我追加子项时我的输入值会被清除？

当我在 a 中附加元素时遇到问题div我输入的所有值包括选定的选项都被清除如下所示正如您所看到的当我单击按钮 A adir tecla 时文本框中的文本和所选选项 Shift 将返回到默认选项 Flechas de movimi
如何隐藏 HTML 文本输入字段中的插入符号？

如果我有一个像这样的 HTML 输入字段
Safari 上使用 React 的日期选择器

我的应用程序使用 Form Input 来自语义 UI 反应 https react semantic ui com collections form 库插入日期它在 Chrome 和 Firefox 上显示日期选择器但在 Safari
如何在 SpiderMonkey JavaScript 中获取控制台输入？

我目前正在使用 Spidermonkey 来运行我的 JavaScript 代码我想知道是否有一个函数可以从控制台获取输入类似于 Python 的做法 var raw input 或者在 C 中 std cin gt gt var 我环
HTML 输入值更改

我有一个 PHP 更新页面其中显示一个包含数据库中的值的文本字段就是这样并且正在工作
无法访问包管理器。安装android应用程序时系统是否正在运行

在模拟器中安装 android 应用程序时出现以下错误请帮我解决这个错误错误信息 emulator exe avd avd name adb wait for device adb install path to apk could
如何使用adb shell输入来输入&符号？

adb shell input text 不起作用也不行adb shell input keyevent KEYCODE AMPERSAND 相关问题 7789826 https stackoverflow com questions 7
使用函数的输出作为另一个函数的输入 python 编码新手

any help is greatly appreciated new to this stuff def total bases int1 int2 int3 int4 int int int int gt integer Return
无法反序列化为对象：类型，KeyError: ' key: int;值：str'

我正在编写一个 python 脚本以使用 azure devops rest api 的 python 客户端库在 azure devops 中创建用户我正在使用添加用户权利的函数会员权利管理客户端链接到该客户端的代码 https
C 控制台底部的输入栏

窗底一些应用程序如 vim mutt aptitude 包含用于输出的顶部窗口部分和底部供用户输入或显示状态假设有一个子进程用于输出另一个子进程用于接受用户输入目的是允许在您键入输入或查看状态的同时更新输出 Actions U
通过类名 JQuery 获取 ID

嗨这是一个jquery问题假设我有这个
读取和打印手臂组件中的字符串

我正在使用 ARMSim 刚刚开始学习汇编所以如果我看起来一无所知请原谅我但我正在尝试从输入文件中读取字符串然后将其打印到输出屏幕到目前为止我有 equ SWI Open 0x66 open a file equ SWI Clos
逐行读取文件而不是逐字读取文件

我正在尝试编写一些代码来扫描输入文件中的回文但它从每个单词而不是每行获取字符串一个例子是赛车会显示为racecar 回文或太热而不能叫回文但相反它会显示为too 不是回文 hot 不是回文等等这是我当前正在执行的读取文件的操作 F
java：使用扫描仪类读取文本文件并将信息存储在数组中

我有一个包含学生成绩的文本文件例如 Kim 40 45 Jack 35 40 我试图从文本文件中读取这些数据并使用扫描仪类将信息存储到数组列表中任何人都可以指导我正确编写代码吗 Code import java io import j
类型错误：“str”对象无法使用 input() 调用[重复]

这个问题在这里已经有答案了我有以下代码它应该询问用户 2 文件名我在第二个函数中的 input 中遇到错误但在第一个函数中没有我不明白这是错误输出 getOutputFile 文件 splitRAW py 第 22 行位于
Delphi - 列表索引越界(4)

我知道这个问题已经被提出了一百万次但是我无法理解为什么这段代码会抛出错误我已经找到了导致错误的罪魁祸首 FOR 循环但是我没有看到它有任何问题我收到错误列表索引超出范围 4 function TNetwork FeedForw
HTML 时间输入类型 - 如何在单击任意位置而不仅仅是单击时钟图标时选择时间菜单视图

I working on the time input type in HTML my problem is when I click on the small clock icon on the right side of the inp
尝试访问工作表范围时出现 VBA 运行时错误 1004

我正在构建一个小型 vba 脚本该脚本将多个工作簿中的表合并到另一个工作簿的一个工作表中当我尝试设置目标范围的值时出现错误 wksPivotData Range wksPivotData Cells CurrentRow 1 Resi
Laravel 输入：get() 不起作用

我正在尝试在 Laravel 4 中使用 post 函数我的表单有许多字段在提交时会转到控制器中的 post 函数问题是表单中的字段名称之间有空格例如 Type 1 是输入的名称中间有一个空格现在当我尝试通过执行以下操作来

随机推荐

C++串口通信

一串口通信的基本原理串口的本质功能是作为 CPU 和串行设备间的编码转换器当数据从 CPU 经过串行端口发送出去时 xff0c 字节数据转换为串行的位 xff08 bit xff09 xff1b 在接收数据时 xff0c 串行的位被转
死锁的四个必要条件以及处理策略

一什么是死锁死锁是指两个或两个以上的进程 xff08 线程 xff09 在运行过程中因争夺资源而造成的一种僵局例如 xff0c 某计算机系统中只有一台打印机和一台输入设备 xff0c 进程P1正占用输入设备 xff0c 同时又提出使用
EM算法简介

1 简介 EM算法是一种迭代优化策略 xff0c 由于它的计算方法中每一次迭代都分两步 xff0c 其中一个为期望步 xff08 E步 xff09 xff0c 另一个为极大步 xff08 M步 xff09 xff0c 所以算法被称为EM算法
三菱PLC MC协议

1 MC协议的目的 xff1a 允许外部设备读写PLC内部寄存器 2 协议格式 xff1a 通讯方式有RS485和TCP IP两种 xff0c 通讯格式有很多种 xff1a 3E 3C 4C 4E帧格式 xff0c 通讯内容分为二进制和AS
find和find_if用法

一 find的用法 STL容器中有很多find xff0c 比如说set xff0c map 他们内部都有内置的find函数 xff0c 一般情况下 xff0c 如果我们用到这些容器 xff0c 那么我们直接用它的内置find就可以了 xf
QTreeView节点拖放

拖放操作分为拖动 Drag 和放置 Drop 两种操作 xff0c 当拖动时需要把拖动的数据进行存储称为编码 xff0c 数据存储为QMimeData类型的对象称为放置数据 xff0c 当执行放置操作时需要把存储的数据读取出来称为解码
OOD七大原则

1 单一职责原则 xff08 Single Responsibility Principle xff09 一个类或一个接口只有一个职责 xff0c 有且仅有一个原因引起变化 2 开闭原则 xff08 Open Closed Principl
微服务探索之路05篇jenkins构建net6和vue docker镜像到Harbor自动更新k8s服务镜像

从1 4篇已经学习了docker Harbor k8s的基本用法接下来进阶一下使用jenkins结合起来做到自动部署项目 1 安装jenkins 1 1前提条件 docker环境 xff0c 可参考第01篇安装docker本文使用的是li
linux为用户添加sudo权限

一 linux为用户添加sudo权限用sudo时提示 34 xxx is not in the sudoers file This incident will be reported 其中XXX是你的用户名 xff0c 这是止当前用户没有
pixhawk多线程编程

金错刀 pixhawk多线程程序编写 pixhawk源码多线程程序的编写主要是针对pixhawk源码进行第二次开发的学习笔记 xff0c 记录下以便日后查阅期望达到的目标添加一个app应用 xff0c 在nsh的后台中运行该应用 xf
[视觉惯性导航系列]相机标定工具--kalibr

前言有很多博主推荐kalibr进行相机标定我参考博主纷繁中淡定 Kalibr标定Intel D435i相机完成相机标定但是kalibr在安装过程中会出现很多令人头秃的报错信息综合了网上好多人的方法才完成本文做一点记录本文不
C++ Exception

Exception type Derived types scattered throughout different library headers bad alloc Exception thrown on failure alloca
什么是最优化问题(Optimization Problem)？

最优化问题是人们在科学研究和生产实践中经常遇到的问题 1 人类所从事的一切生产或者社会活动均是有目的的其行为总是在特点的价值观念或者审美取向的支配下进行的 xff0c 因此经常面临一个可行的甚至是最优化的方案的决策问题这就是最优化问题
单例模式（java代码实现）

应用单例模式时 xff0c 类只能有一个对象实例 xff0c 这么做的目的是避免不一致状态饿汉式单例 xff1a xff08 立即加载 xff09 饿汉式单例 public class Singleton1 指向自己实例的私有静态引用 x
C++函数后面加“：”的含义

转载 xff1a C 43 43 函数后面加 xff1a 的含义 hhd1988的专栏 CSDN博客 1 c 43 43 成员函数后面跟 xff1a 表示的是赋值 xff0c 这是c 43 43 的特性如下 xff1a A int aa
因子图（factor graph）

因子图 xff08 factor graph xff09 Factor Graph 是概率图的一种 xff0c 概率图有很多种 xff0c 最常见的就是Bayesian Network 贝叶斯网络和Markov Random Fields
词袋模型（Bag of Features，BOF）

Bag of Features xff08 BOF xff09 对于程序而言这个人就是一堆像素嘛 xff0c 让它直接找的话它只能一个个像素的去比较然后返回最接近的了 xff08 近邻算法 xff09 但是现实中物体的形状颜色会发生变化 x
SNMPv3基于用户的安全模型USM及消息格式

一 USM相关网址 SNMPv3使用了基于用户的安全模型USM RFC 3411 Architecture for SNMP Frameworks http www ietf org rfc rfc3411 txtRFC 3414 User
超详细的python搭建区块链（下）

在前面超详细的python搭建区块链 xff08 中 xff09 我们搭建了一个简单的区块链在这个简单的区块链能够实现交易挖矿等基本功能不过 xff0c 区块链上的节点应该是分散的如果它们是分散的 xff0c 我们究竟如何确保它们
RuntimeError: Expected 4-dimensional input for 4-dimensional weight [32, 1, 5, 5]

文章目录 1 问题引入2 运行报错3 代码4 分析原因5 解决办法6 完整代码7 参考文献 1 问题引入今天在使用pytorch训练一个模型的 xff0c 数据集的读取是使用pytorch自带的函数来进行读取和预处理的 xff0c 网络使