【Pytorch】卷积神经网络实现手写数字识别

2023-11-09

【Pytorch】卷积神经网络实现手写数字识别

1 加载数据
2 模型构建
3 训练模型
4 模型保存
5 模型加载和使用

1 加载数据

分别构建训练集和测试集（验证集）
DataLoader来迭代取数据

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets,transforms 
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline


# 定义超参数 
input_size = 28  #图像的总尺寸28*28
num_classes = 10  #标签的种类数
num_epochs = 3  #训练的总循环周期
batch_size = 64  #一个撮（批次）的大小，64张图片

# 训练集
train_dataset = datasets.MNIST(root='./data',  
                            train=True,   
                            transform=transforms.ToTensor(),  
                            download=True) 

# 测试集
test_dataset = datasets.MNIST(root='./data', 
                           train=False, 
                           transform=transforms.ToTensor())

# 构建batch数据
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, 
                                           batch_size=batch_size, 
                                           shuffle=True)

2 模型构建

构建卷积神经网络，一般卷积层，relu层，池化层可以写成一个套餐

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Sequential(         # 输入大小 (1, 28, 28)
            nn.Conv2d(
                in_channels=1,              # 灰度图
                out_channels=16,            # 要得到几多少个特征图
                kernel_size=5,              # 卷积核大小
                stride=1,                   # 步长
                padding=2,                  # 
            ),                              # 输出的特征图为 (16, 28, 28)
            nn.ReLU(),                      # relu层
            nn.MaxPool2d(kernel_size=2),    # 进行池化操作（2x2 区域）, 输出结果为： (16, 14, 14)
        )
        self.conv2 = nn.Sequential(         # 下一个套餐的输入 (16, 14, 14)
            nn.Conv2d(16, 32, 5, 1, 2),     # 输出 (32, 14, 14)
            nn.ReLU(),                      # relu层
            nn.MaxPool2d(2),                # 输出 (32, 7, 7)
        )
        self.out = nn.Linear(32 * 7 * 7, 10)   # 全连接层得到的结果

    def forward(self, x):
       
        x = self.conv1(x)
        x = self.conv2(x)
        x = x.view(x.size(0), -1)           # flatten操作，结果为：(batch_size, 32 * 7 * 7)
        output = self.out(x)
        return output

3 训练模型

准确率作为评估标准

def accuracy(predictions, labels):
    pred = torch.max(predictions.data, 1)[1] 
    rights = pred.eq(labels.data.view_as(pred)).sum() 
    return rights, len(labels)

# 实例化
net = CNN() 
#损失函数
criterion = nn.CrossEntropyLoss() 
#优化器
optimizer = optim.Adam(net.parameters(), lr=0.001) #定义优化器，普通的随机梯度下降算法

#开始训练循环
for epoch in range(num_epochs):
    #当前epoch的结果保存下来
    train_rights = [] 
    
    for batch_idx, (data, target) in enumerate(train_loader):  #针对容器中的每一个批进行循环
        net.train()                             
        output = net(data) 
      
        loss = criterion(output, target) 
        optimizer.zero_grad() # 梯度归o
        loss.backward() 
        optimizer.step()  # 更新优化器的学习率
        right = accuracy(output, target) 
        train_rights.append(right) 

    
        if batch_idx % 100 == 0: 
            
            net.eval() 
            val_rights = [] 
            
            for (data, target) in test_loader:
                output = net(data) 
                right = accuracy(output, target) 
                val_rights.append(right)
                
            #准确率计算
            train_r = (sum([tup[0] for tup in train_rights]), sum([tup[1] for tup in train_rights]))
            val_r = (sum([tup[0] for tup in val_rights]), sum([tup[1] for tup in val_rights]))

            print('当前epoch: {} [{}/{} ({:.0f}%)]\t损失: {:.6f}\t训练集准确率: {:.2f}%\t测试集正确率: {:.2f}%'.format(
                epoch, batch_idx * batch_size, len(train_loader.dataset),
                100. * batch_idx / len(train_loader), 
                loss.data, 
                100. * train_r[0].numpy() / train_r[1], 
                100. * val_r[0].numpy() / val_r[1]))

输出

当前epoch: 0 [0/60000 (0%)]	损失: 2.287790	训练集准确率: 14.06%	测试集正确率: 11.06%
当前epoch: 0 [6400/60000 (11%)]	损失: 0.402259	训练集准确率: 75.60%	测试集正确率: 92.08%
当前epoch: 0 [12800/60000 (21%)]	损失: 0.071038	训练集准确率: 84.53%	测试集正确率: 94.49%
当前epoch: 0 [19200/60000 (32%)]	损失: 0.055919	训练集准确率: 88.09%	测试集正确率: 96.30%
当前epoch: 0 [25600/60000 (43%)]	损失: 0.065247	训练集准确率: 90.17%	测试集正确率: 97.37%
当前epoch: 0 [32000/60000 (53%)]	损失: 0.101428	训练集准确率: 91.52%	测试集正确率: 97.45%
当前epoch: 0 [38400/60000 (64%)]	损失: 0.119459	训练集准确率: 92.52%	测试集正确率: 97.69%
当前epoch: 0 [44800/60000 (75%)]	损失: 0.062872	训练集准确率: 93.21%	测试集正确率: 97.87%
当前epoch: 0 [51200/60000 (85%)]	损失: 0.044197	训练集准确率: 93.75%	测试集正确率: 97.86%
当前epoch: 0 [57600/60000 (96%)]	损失: 0.140018	训练集准确率: 94.13%	测试集正确率: 98.00%
当前epoch: 1 [0/60000 (0%)]	损失: 0.020221	训练集准确率: 100.00%	测试集正确率: 98.44%
当前epoch: 1 [6400/60000 (11%)]	损失: 0.084976	训练集准确率: 98.02%	测试集正确率: 98.33%
当前epoch: 1 [12800/60000 (21%)]	损失: 0.098251	训练集准确率: 97.92%	测试集正确率: 98.39%
当前epoch: 1 [19200/60000 (32%)]	损失: 0.078864	训练集准确率: 98.00%	测试集正确率: 98.47%
当前epoch: 1 [25600/60000 (43%)]	损失: 0.025394	训练集准确率: 98.13%	测试集正确率: 98.40%
当前epoch: 1 [32000/60000 (53%)]	损失: 0.042705	训练集准确率: 98.13%	测试集正确率: 98.28%
当前epoch: 1 [38400/60000 (64%)]	损失: 0.027868	训练集准确率: 98.13%	测试集正确率: 98.57%
当前epoch: 1 [44800/60000 (75%)]	损失: 0.010066	训练集准确率: 98.17%	测试集正确率: 98.57%
当前epoch: 1 [51200/60000 (85%)]	损失: 0.035174	训练集准确率: 98.19%	测试集正确率: 98.68%
当前epoch: 1 [57600/60000 (96%)]	损失: 0.021053	训练集准确率: 98.25%	测试集正确率: 98.61%
当前epoch: 2 [0/60000 (0%)]	损失: 0.004226	训练集准确率: 100.00%	测试集正确率: 98.46%
当前epoch: 2 [6400/60000 (11%)]	损失: 0.012750	训练集准确率: 98.69%	测试集正确率: 98.78%
当前epoch: 2 [12800/60000 (21%)]	损失: 0.071001	训练集准确率: 98.59%	测试集正确率: 98.24%
当前epoch: 2 [19200/60000 (32%)]	损失: 0.116683	训练集准确率: 98.67%	测试集正确率: 98.75%
当前epoch: 2 [25600/60000 (43%)]	损失: 0.082070	训练集准确率: 98.65%	测试集正确率: 98.79%
当前epoch: 2 [32000/60000 (53%)]	损失: 0.011719	训练集准确率: 98.65%	测试集正确率: 98.93%
当前epoch: 2 [38400/60000 (64%)]	损失: 0.044769	训练集准确率: 98.66%	测试集正确率: 98.81%
当前epoch: 2 [44800/60000 (75%)]	损失: 0.181679	训练集准确率: 98.67%	测试集正确率: 99.07%
当前epoch: 2 [51200/60000 (85%)]	损失: 0.022912	训练集准确率: 98.67%	测试集正确率: 98.77%
当前epoch: 2 [57600/60000 (96%)]	损失: 0.084802	训练集准确率: 98.69%	测试集正确率: 98.77%

4 模型保存

# 只保存模型参数
# torch.save(net.state_dict(), 'cov.pkl')
# 加载
# model = CNN() 
# model.load_state_dict(torch.load('\cov.pkl'))


# 保存
torch.save(net, 'cov.pkl')
# 加载
#model = torch.load('\cov.pkl')

5 模型加载和使用

model = torch.load('cov.pkl')
print(model)

输出

CNN(
  (conv1): Sequential(
    (0): Conv2d(1, 16, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (1): ReLU()
    (2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (conv2): Sequential(
    (0): Conv2d(16, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (1): ReLU()
    (2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (out): Linear(in_features=1568, out_features=10, bias=True)
)

import cv2
import matplotlib.pyplot as plt

# 第一步：读取图片
img = cv2.imread('./data/test/4.png') 
print(img.shape)

# 第二步：将图片转为灰度图
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
print(img.shape)
plt.imshow(img,cmap='Greys')

# 第三步：将图片的底色和字的颜色取反
img = cv2.bitwise_not(img)
plt.imshow(img,cmap='Greys')


# 第四步：将底变成纯白色，将字变成纯黑色
img[img<=144]=0
img[img>140]=255  # 130

# 显示图片
plt.imshow(img,cmap='Greys')
 

# 第五步：将图片尺寸缩放为输入规定尺寸
img = cv2.resize(img,(28,28))

# 第六步：将数据类型转为float32
img = img.astype('float32')

# 第七步：数据正则化
img /= 255

# 第八步：增加维度为输入的规定格式
img = img.reshape(1,1, 28, 28)
print(img.shape)

# 第九步：预测
pred = model(torch.from_numpy(img))

# 第十步：输出结果
print(pred.argmax())

输出

(384, 317, 3)
(384, 317)
(1, 1, 28, 28)
tensor(4)

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

cnn

深度学习

【Pytorch】卷积神经网络实现手写数字识别的相关文章

pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
二维数组的按行 numpy.isin [重复]

这个问题在这里已经有答案了我有两个数组 A np array 3 1 4 1 1 4 B np array 0 1 5 2 4 5 2 3 5 是否可以使用numpy isin二维数组按行排列我想检查一下是否A i j is in B
如何在 google colab 中运行 matlab .m 文件

我目前正在尝试运行这个存储库https github com Fanziapril mvfnet https github com Fanziapril mvfnet这需要一个步骤 Run the Matlab ModelGeneratio
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
删除 Torch 张量中的行

我有一个火炬张量如下 a tensor 0 2215 0 5859 0 4782 0 7411 0 3078 0 3854 0 3981 0 5200 0 1363 0 4060 0 2030 0 4940 0 1640 0 6025 0
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat
torch.mm、torch.matmul 和 torch.mul 有什么区别？

阅读完 pytorch 文档后我仍然需要帮助来理解之间的区别torch mm torch matmul and torch mul 由于我不完全理解它们所以我无法简明地解释这一点 B torch tensor 1 1207 0 3137
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
Blenderbot 微调

我一直在尝试微调 HuggingFace 的对话模型 Blendebot 我已经尝试过官方拥抱脸网站上给出的传统方法该方法要求我们使用 trainer train 方法来完成此操作我使用 compile 方法尝试了它我尝试过使用 Py
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
Pytorch RuntimeError：“host_softmax”未针对“torch.cuda.LongTensor”实现

我正在使用 pytorch 来训练模型但是在计算交叉熵损失时我遇到了运行时错误 Traceback most recent call last File deparser py line 402 in
如何在不安装pytorch的情况下使用pytorch预训练模型？

我只想在 pytorch 中使用预先训练的模型而不安装整个包我可以从 pytorch 复制模型模块吗恐怕你不能这样做为了运行模型你不仅需要经过训练的权重 pth tar 文件还需要网络的结构即层它们如何相互连接等该网络结
Pytorch 中是否有一种方法可以以可反向传播的方式计算唯一值的数量？

给定以下张量这是网络的结果注意 grad fn tensor 121 241 125 1 108 238 125 121 13 117 121 229 161 13 0 202 161 121 121 0 121 121 242 125
运行时错误：大小不匹配，m1：[4 x 3136]，m2：[64 x 5]位于c：\ a \ w \ 1 \ s \ tmp_conda_3.7_1

我使用 python 3 当我插入变换随机裁剪大小 224 时它会给出未匹配错误这是我的代码 https github com kajasumanie medical plant classification blob master i

随机推荐

【C++碎碎念】C++11新特性（声明、智能指针、右值引用、lambda表达式）

目录一新类型二统一的初始化三声明四智能指针五右值引用六 Lambda表达式一新类型 C 11新增了long long和unsigned long long 以支持64位或更宽的整型新增了类型char16 t
数据结构顺序表的定义

文章目录 1 2 1 顺序表的定义 1 2 2 顺序表上基本操作的实现 1 顺序表的建立 2 顺序表元素的插入 3 顺序表元素的删除 4 顺序表的查找 1 2 1 顺序表的定义定义顺序表是用一组地址连续的存储单元依次存储线性表中的数据元
flutter滚动到底部_flutter ScrollController如何滚动到底部？

flutter ScrollController滚动到底部的示例代码如下方式一 import package flutter scheduler dart import package flutter material dart void
微信小程序开发全流程记录（从前台到后台，到发布）

微信小程序开发流程记录一代码处理一微信小程序前端显示微信小程序项目的架构部分特点说明二后台服务器数据交互需要的环境特别注意二项目部署一 Wampserver的设置二域名的获取三小程序官方网站上的设置一
阿里大数据之路：数据模型篇大总结

第1章大数据领域建模综 1 1 为什么需要数据建模有结构地分类组织和存储是我们面临的一个挑战数据模型强调从业务数据存取和使用角度合理存储数据数据模型方法以便在性能成本效率之间取得最佳平衡成本良好的数据模型能极大地减少不必
Linux添加yum源,yum下载速度过慢

CentOS系统更换yum软件安装源此处以网易为例第一步备份你的原镜像文件以免出错后可以恢复 mv etc yum repos d CentOS Base repo etc yum repos d CentOS Base repo
英伟达新方法入选CVPR 2023：对未知物体的6D姿态追踪和三维重建

普通手机随手拍的雕像一下就变成了精细的三维重建图水杯来回动的动态场景下细节清晰可见静态场景效果也同样nice 狗狗突出的肋骨都被还原了出来对比来看其他方法效果是酱婶的这就是英伟达最新提出的方法BundleSDF 这是一种可
什么是JVM

什么是JVM JVM 内存结构虚拟机的前世今生从虚拟机的发展到未来的技术发展未来的Java技术 JVM整体介绍 JVM各版本内存区域的变化直接内存深入分析栈和堆 JVM中的对象 JVM中对象的分配 Java中的泛型垃圾回收算法与
PHP发送邮件详细说明

这两天琢磨了php得原生发送邮件发现自带得mail方法不太好用于是上网查询了好多方法亲测以下方法能用源代码都在我的github 到github上下载 https github com PHPMailer PHPMailer htt
2021年“泰迪杯”数据分析技能赛B 题+肥料登记数据分析数据集

2021 年泰迪杯数据分析技能赛 B 题肥料登记数据分析一背景肥料是农业生产中一种重要的生产资料其生产销售必须遵循肥料登记管理办法依法在农业行政管理部门进行登记各省自治区直辖市人民政府农业行政主管部门主要负责本行
vue-$nextTick使用详解

在vue应用中我们会碰到 nextTick这个东西偶尔也会使用多半是与DOM加载相关不知道 nextTick为何物这里搜寻了下资料做一下总结 nextTick说明在下次Dom更新循环结束之后执行延迟回调就是说此次数据变化在
Python自学笔记3-数据类型

Pytho的数值类型包括 name purpose int 整型 long 长整型 Python3中没有 float 浮点数 complex 复数代码示例 x 3 整数 f 3 141529 浮点数 name Python 字符串 big
【适合一战成硕的你】考研408笔记（计算机网络）王道+天勤（你再也不用做笔记了）拿捏408.

考研408笔记系列提示点击下面的超链接可以直接到达自己想要的专栏 45分考研408笔记数据结构王道天勤 45分考研408笔记计算机组成原理王道天勤 35分考研408笔记操作系统王道天勤 25分考研408笔记计
Kali下安装 dvwa 的完整详细教程

kali之DVWA DVWA共有十个模块分别是 1 Brute Force 暴力破解 2 Command Injection 命令行注入 3 CSRF 跨站请求伪造 4 File Inclusion 文件包含 5 File Upload
常用的Dos命令与打开cmd的方式

打开CMD的方式开始系统命令提示符 Win键 R 输入cmd 打开控制台推荐在任意的文件夹下面按住shift键鼠标右键点击在此打开命令行窗口资源管理器的地址栏前面加上cmd 空格路径选择以管理员方式运行常用的Dos命
符合ISO26262标准的建模规范检查模型静态分析静态测试工具

符合ISO26262标准的建模规范检查模型静态分析静态测试工具 Model Examiner 功能安全解决方案以下简称MXAM 测试套件是您进行全面静态模型分析的首选工具 MXAM提供了一种简单的方法来检查建模规范分析模型结构和评估模型
GB2312码表

转载https blog csdn net oshan2012 article details 79070705
【实践】第一个驱动之自动生成主设备号和设备文件

1 声明两个变量 static struct class firstdrv class static struct class device firstdrv class dev 2 修改函数first drv init void 和fir
解决同时安装搜狗输入法和谷歌输入法后fcitx无法使用

问题描述使用搜狗输入法发现老是出现乱码的问题然后会提示你删除一个搜狗的文件后重启才能正常使用因此本人后来听了实验室师兄的建议又直接安装了谷歌输入法结果刚开始用着正常后来突然用着界面右上角的fcitx标志直接消失了输入法也用不了
【Pytorch】卷积神经网络实现手写数字识别

Pytorch 卷积神经网络实现手写数字识别 1 加载数据 2 模型构建 3 训练模型 4 模型保存 5 模型加载和使用 1 加载数据分别构建训练集和测试集验证集 DataLoader来迭代取数据 import torch import

【Pytorch】卷积神经网络实现手写数字识别

【Pytorch】卷积神经网络实现手写数字识别

1 加载数据

2 模型构建

3 训练模型

4 模型保存

5 模型加载和使用

【Pytorch】卷积神经网络实现手写数字识别 的相关文章

随机推荐

热门标签

【Pytorch】卷积神经网络实现手写数字识别的相关文章