【Pytorch】循环神经网络实现手写体识别

2023-11-13

【Pytorch】循环神经网络实现手写体识别

1 数据集加载
2 搭建RNN模型
3 训练模型
4 模型保存和加载
模型测试

1 数据集加载

import seaborn as sns
sns.set(font_scale=1.5,style="white") 
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import time
import copy

import torch
from torch import nn
import torch.nn.functional as F
import torch.optim as optim
import torchvision
import torch.utils.data as Data
from torchvision import transforms

## 准备训练数据集Minist
train_data  = torchvision.datasets.MNIST(root='./data',  
                            train=True,   
                            transform=transforms.ToTensor(),  
                            download=True) 
## 定义一个数据加载器
train_loader = Data.DataLoader(
    dataset = train_data, ## 使用的数据集
    batch_size=64, # 批处理样本大小
    shuffle = True, # 每次迭代前打乱数据
    num_workers = 2, # 使用两个进程 
)


##  可视化训练数据集的一个batch的样本来查看图像内容
for step, (b_x, b_y) in enumerate(train_loader):  
    if step > 0:
        break
## 输出训练图像的尺寸和标签的尺寸，都是torch格式的数据
print(b_x.shape)
print(b_y.shape)
train_data

输出

torch.Size([64, 1, 28, 28])
torch.Size([64])
Dataset MNIST
    Number of datapoints: 60000
    Root location: ./data
    Split: Train
    StandardTransform
Transform: ToTensor()

## 准备需要使用的测试数据集
test_data  = torchvision.datasets.MNIST(root='./data', 
                           train=False, 
                           transform=transforms.ToTensor())
## 定义一个数据加载器
test_loader = Data.DataLoader(
    dataset = test_data, ## 使用的数据集
    batch_size=64, # 批处理样本大小
    shuffle = True, # 每次迭代前打乱数据
    num_workers = 2, # 使用两个进程 
)


##  可视化训练数据集的一个batch的样本来查看图像内容
for step, (b_x, b_y) in enumerate(train_loader):  
    if step > 0:
        break
## 输出训练图像的尺寸和标签的尺寸，都是torch格式的数据
print(b_x.shape)
print(b_y.shape)
test_data

输出

torch.Size([64, 1, 28, 28])
torch.Size([64])
Dataset MNIST
    Number of datapoints: 10000
    Root location: ./data
    Split: Test
    StandardTransform
Transform: ToTensor()

2 搭建RNN模型

class RNNimc(nn.Module):
    def __init__(self, input_dim, hidden_dim, layer_dim, output_dim):
        """
        input_dim:输入数据的维度(图片每行的数据像素点)
        hidden_dim: RNN神经元个数
        layer_dim: RNN的层数
        output_dim:隐藏层输出的维度(分类的数量)
        """
        super(RNNimc, self).__init__()
        self.hidden_dim = hidden_dim ## RNN神经元个数
        self.layer_dim = layer_dim ## RNN的层数
        # RNN
        self.rnn = nn.RNN(input_dim, hidden_dim, layer_dim,
                          batch_first=True, nonlinearity='relu')
        
        # 连接全连阶层
        self.fc1 = nn.Linear(hidden_dim, output_dim)
    def forward(self, x):
        # x:[batch, time_step, input_dim]
        # 本例中time_step＝图像所有像素数量／input_dim
        # out:[batch, time_step, output_size]
        # h_n:[layer_dim, batch, hidden_dim]
        out, h_n = self.rnn(x, None) # None表示h0会使用全0进行初始化
        # 选取最后一个时间点的out输出
        out = self.fc1(out[:, -1, :]) 
        return out

## 模型的调用
input_dim=28   # 图片每行的像素数量
hidden_dim=128  # RNN神经元个数
layer_dim = 1  # RNN的层数
output_dim=10  # 隐藏层输出的维度(10类图像)
MyRNNimc = RNNimc(input_dim, hidden_dim, layer_dim, output_dim)
print(MyRNNimc)

输出

RNNimc(
  (rnn): RNN(28, 128, batch_first=True)
  (fc1): Linear(in_features=128, out_features=10, bias=True)
)

3 训练模型

## 对模型进行训练
optimizer = torch.optim.RMSprop(MyRNNimc.parameters(), lr=0.0003)  
criterion = nn.CrossEntropyLoss()   # 损失函数
train_loss_all = []
train_acc_all = []
test_loss_all = []
test_acc_all = []
num_epochs = 30
for epoch in range(num_epochs):
    print('Epoch {}/{}'.format(epoch, num_epochs - 1))
    MyRNNimc.train() ## 设置模型为训练模式
    corrects = 0
    train_num  = 0
    for step,(b_x, b_y) in enumerate(train_loader):
        # input :[batch, time_step, input_dim]
        xdata = b_x.view(-1, 28, 28)
        output = MyRNNimc(xdata)     
        pre_lab = torch.argmax(output,1)
        loss = criterion(output, b_y) 
        optimizer.zero_grad()        
        loss.backward()       
        optimizer.step()  
        loss += loss.item() * b_x.size(0)
        corrects += torch.sum(pre_lab == b_y.data)
        train_num += b_x.size(0)
    ## 计算经过一个epoch的训练后在训练集上的损失和精度
    train_loss_all.append(loss / train_num)
    train_acc_all.append(corrects.double().item()/train_num)
    print('{} Train Loss: {:.4f}  Train Acc: {:.4f}'.format(
        epoch, train_loss_all[-1], train_acc_all[-1]))
    ## 设置模型为验证模式
    MyRNNimc.eval()
    corrects = 0
    test_num  = 0
    for step,(b_x, b_y) in enumerate(test_loader):
        # input :[batch, time_step, input_dim]
        xdata = b_x.view(-1, 28, 28)
        output = MyRNNimc(xdata)     
        pre_lab = torch.argmax(output,1)
        loss = criterion(output, b_y) 
        loss += loss.item() * b_x.size(0)
        corrects += torch.sum(pre_lab == b_y.data)
        test_num += b_x.size(0)
    ## 计算经过一个epoch的训练后在测试集上的损失和精度
    test_loss_all.append(loss / test_num)
    test_acc_all.append(corrects.double().item()/test_num)
    print('{} Test Loss: {:.4f}  Test Acc: {:.4f}'.format(
        epoch, test_loss_all[-1], test_acc_all[-1]))

4 模型保存和加载

# 保存
torch.save(MyRNNimc, 'rnn.pkl')

model = torch.load('rnn.pkl')
print(model)

输出

RNNimc(
  (rnn): RNN(28, 128, batch_first=True)
  (fc1): Linear(in_features=128, out_features=10, bias=True)
)

模型测试

import cv2
import matplotlib.pyplot as plt

# 第一步：读取图片
img = cv2.imread('./data/test/8.png') 
print(img.shape)

# 第二步：将图片转为灰度图
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
print(img.shape)
plt.imshow(img,cmap='Greys')

# 第三步：将图片的底色和字的颜色取反
img = cv2.bitwise_not(img)
plt.imshow(img,cmap='Greys')

# 第四步：将底变成纯白色，将字变成纯黑色
img[img<=144]=0
img[img>140]=255  # 130

# 显示图片
plt.imshow(img,cmap='Greys')

# 第五步：将图片尺寸缩放为输入规定尺寸
img = cv2.resize(img,(28,28))

# 第六步：将数据类型转为float32
img = img.astype('float32')

# 第七步：数据正则化
img /= 255

img = img.reshape(1,784)
# 第八步：增加维度为输入的规定格式

_img = torch.from_numpy(img).float()
# _img = torch.from_numpy(img).unsqueeze(0)

输出

(234, 182, 3)
(234, 182)

在这里插入图片描述

model.eval()
_img = _img.view(-1, 28, 28)
# 第九步：预测
outputs = model(_img)

# 第十步：输出结果
print(outputs.argmax())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

RNN

深度学习

【Pytorch】循环神经网络实现手写体识别的相关文章

推导 pytorch 网络的结构

对于我的用例我需要能够采用 pytorch 模块并解释模块中的层序列以便我可以以某种文件格式在层之间创建连接现在假设我有一个简单的模块如下所示 class mymodel nn Module def init self input
用我自己的值初始化pytorch卷积层

我想知道是否有办法用我自己的值初始化 pytorch 卷积过滤器例如我有一个元组 0 8423 0 3778 3 1070 2 6518 我想用这些值初始化 2X2 过滤器我该怎么做我查找了一些答案但他们大多使用火炬正态分布和其他
无法将 cuda:0 设备类型张量转换为 numpy。首先使用 Tensor.cpu() 将张量复制到主机内存

我试图展示 GAN 网络在某些指定时期的结果打印当前结果的功能之前是在 TF 中使用的我需要换成pytorch def show result G net z num epoch show False save False path r
Pytorch 分析器显示两个不同网络的卷积平均执行时间不同

我有两个网络我正在对它们进行分析以查看哪些操作占用了大部分时间我注意到CUDA time avg为了aten conv2d不同网络的操作有所不同这也增加了一个数量级在我的第一个网络中它是22us 而对于第二个网络则是3ms 我的第
PoseWarping：如何矢量化此 for 循环（z 缓冲区）

我正在尝试使用地面真实深度图姿势信息和相机矩阵将帧从视图 1 扭曲到视图 2 我已经能够删除大部分 for 循环并将其矢量化除了一个 for 循环扭曲时由于遮挡视图 1 中的多个像素可能会映射到视图 2 中的单个位置在这种情况下
如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
Pytorch：了解 nn.Module 类内部如何工作

一般来说一个nn Module可以由子类继承如下所示 def init weights m if type m nn Linear torch nn init xavier uniform m weight class LinearRe
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
查找张量中沿轴的非零元素的数量

我想找到沿特定轴的张量中非零元素的数量有没有 PyTorch 函数可以做到这一点我尝试使用非零 http pytorch org docs master torch html highlight nonzero torch nonzer
在pytorch中使用tensorboard，但得到空白页面？

我在pytorch 1 3 1中使用tensorboard 并且我在张量板的 pytorch 文档 https pytorch org docs stable tensorboard html 运行后tensorboard logdir r
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
删除 Torch 张量中的行

我有一个火炬张量如下 a tensor 0 2215 0 5859 0 4782 0 7411 0 3078 0 3854 0 3981 0 5200 0 1363 0 4060 0 2030 0 4940 0 1640 0 6025 0
为什么 PyTorch nn.Module.cuda() 不将模块张量移动到 GPU，而仅将参数和缓冲区移动到 GPU？

nn Module cuda 将所有模型参数和缓冲区移动到 GPU 但为什么不是模型成员张量呢 class ToyModule torch nn Module def init self gt None super ToyModule se
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8

随机推荐

龙书笔记（13）

chap 13 地形绘制基础主要是创建一个地形类 Terrain 1 高度图其实是一个数组每个元素都指定了地形方格中某一顶点的高度值每个元素只分配了1个字节的存储空间当加载到程序时重新分配浮点型或整型数据来存储这些高度
CentOS7开机时的菜单选项及时间的修改

转载记录以防丢失一在CentOS更新后并不会自动删除旧内核所以在启动选项中会有多个内核选项可以手动使用以下命令删除多余的内核正常下第一个选项正常启动第二个选项急救模式启动系统出项问题不能正常启动时使用并修复系统 1 查看
记录一下树莓派打内核补丁cjktty的天坑

首先cjktty的下载地址在此大家根据自己的linux内核去选择 https github com zhmars cjktty patches 下载好了补丁文件之后需要下载完整的linux内核是的完整的 https github co
ahut 月赛1

心得一点一点理解对于一段要学习的代码跟着写下来理解一点写一点对于一道题目用记事本看题目看一句题目用自己的话概括一句写在记事本上并将自己的想法一并写下来这样做下来心会很平静你会发现理解一段代码并不费力解决一道
Cookie、cookie与session区别

Cookie Cookie 有时也用其复数形式 Cookies 类型为小型文本文件是某些网站为了辨别用户身份进行Session跟踪而储存在用户本地终端上的数据通常经过加密由用户客户端计算机暂时或永久保存的信息 Cookie有什么用
一个字节造成的巨大性能差异——SQL Server存储结构

今天同事问了我一个SQL的问题关于SQL Server内部存储结构的我觉得挺有意思所以写下这篇博客讨论并归纳了一下问题是这样的首先我们创建两张表一张表的列长度是4039字节另一张表的长度是4040字节他们就只有一个字节的差距
阿里巴巴 cola设计架构

https github com alibaba COLA
leetcode 21 合并两个有序链表（c++和python）

目录题目描述解题思路 C 代码 python代码题目描述将两个有序链表合并为一个新的有序链表并返回新链表是通过拼接给定的两个链表的所有节点组成的示例输入 1 gt 2 gt 4 1 gt 3 gt 4 输出 1 gt 1 gt
golang的chan(管道)

golang的chan翻译成中文就是管道顾名思义就是管道的一端用来读另一端用来写这与write和read函数的性质是非常相似的比如说管道中没数据就会发生读阻塞管道中数据是满的就会发生写阻塞又类似生产者和消费者也就是必须有
大学生python实验心得体会_大学生实训心得体会3篇

转眼间为期两个星期的实训就结束了但是安利公司的物流配送黄埔港益邦物流公司南沙港以及学校里面的航海模拟实验中心轮机实训实验楼这些实训过程仍历历在目以下是小编整理的大学生实训心得体会欢迎阅读大学生实训心得体会1 通过实训中心老师
微信小程序-flex布局：垂直、水平方向-自动填充满剩余空间

在微信小程序项目中经常需要将水平或垂直方向分成两大部分一部分内容宽度或高度固定剩余的一部分需填充满剩余空间那么该怎么快速解决这类布局效果图如下垂直方向水平方向我个人比较喜欢使用flex布局面对此类布局最先想到的也是fle
【HDLBits 刷题 12】Circuits（8）Finite State Manchines 27-34

目录写在前面 Finite State Manchines 2014 q3c m2014 q6b m2014 q6c m2014 q6 2012 q2fsm 2012 q2b 2013 q2afsm 2013 q2bfsm 写在前面 HD
类和对象笔记（1.类和对象的关系，类基本架构）

梳理C 基础纯干货或许会很干燥 gt gt gt gt gt 分界线类指对象的类型类代表了一批对象的共性和特征抽象的不占用内存对象类的具体实例具体的占用储存空间类是对象的抽象对象是类的具体实例可以同结构体进行比较学
eclipse常用插件之FindBugs

1 简介 FindBugs 是由马里兰大学提供的一款开源 Java静态代码分析工具 FindBugs通过检查类文件或 JAR文件将字节码与一组缺陷模式进行对比从而发现代码缺陷完成静态代码分析 FindBugs既提供可视化 UI 界面同
打印金字塔代码

Description 输入n值打印下列形状的金字塔其中n代表金字塔的层数 Input 输入只有一个正整数n Output 打印金字塔图形其中每个数字之间有一个空格 include
JsonMap对象的获取与前台浏览器报错Uncaught TypeError: Cannot read property '0' of undefined

JsonMap对象的获取与前台浏览器报错Uncaught TypeError Cannot read property 0 of undefined 后台问题在浏览器报错很多时候在我们遇到浏览器报错的时候都会去前端js里去找错但有时候确
一起学nRF51xx 15 - spis

前言 SPIS是一个从SPI 它与EasyDMA一起支持与外部的主SPI超低功耗串行通信 EasyDMA使得SPIS交互无需CPU的介入在提高数据传输效率的同时还减轻了CPU的负担 SPIS即是SPI从模式但它比stm32中直接将spi
Android开发：最全面、最易懂的Android屏幕适配解决方案

前言 Android的屏幕适配一直以来都在折磨着我们Android开发者本文将结合 Google的官方权威适配文档郭霖 Android官方提供的支持不同屏幕大小的全部方法 Stormzhang Android 屏幕适配鸿洋 Andro
Wireshark抓包分析交换机工作原理

实验名称交换机工作原理实验目的 1 熟悉Linux虚拟网络环境 2 熟悉Linux中network namespace的基本操作 3 熟悉Linux中虚拟以太网设备Tap和veth pair的基本操作 4 熟悉Linux中Bridge设
【Pytorch】循环神经网络实现手写体识别

Pytorch 循环神经网络实现手写体识别 1 数据集加载 2 搭建RNN模型 3 训练模型 4 模型保存和加载模型测试 1 数据集加载 import seaborn as sns sns set font scale 1 5 style

【Pytorch】循环神经网络实现手写体识别

【Pytorch】循环神经网络实现手写体识别

1 数据集加载

2 搭建RNN模型

3 训练模型

4 模型保存和加载

模型测试

【Pytorch】循环神经网络实现手写体识别 的相关文章

随机推荐

热门标签

【Pytorch】循环神经网络实现手写体识别的相关文章