LeNet-5识别数字

2023-11-14

LeNet识别数字

前言
环境
实现
结果

前言

实现经典卷积神经网络LeNet(LeNet-5)识别数字，这里将激活函数从sigmoid换成ReLU，参考资料《动手学深度学习》。

环境

python+pytorch

实现

import torch
import torch.nn as nn
import torchvision
import matplotlib.pyplot as plt
from torch.utils import data
from torchvision import transforms
import cv2 as cv

#下载数据集
trans = transforms.ToTensor()
mnist_train = torchvision.datasets.MNIST(
    root="./drive/MyDrive/ex/data", transform=trans, train=True, download=True) 
mnist_test = torchvision.datasets.MNIST(
    root="./drive/MyDrive/ex/data", transform=trans, train=False, download=True)
# root后的路径为数据集下载后的保存路径

# 定义网络
class Reshape(nn.Module):
    def forward(self, x):
        return x.view(-1, 1, 28, 28)

net = nn.Sequential(
    Reshape(),
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.ReLU(),
    nn.Linear(120, 84), nn.ReLU(),
    nn.Linear(84, 10))

#读取数据
batch_size = 256
train_iter = data.DataLoader(mnist_train, shuffle=True, batch_size=batch_size, num_workers=4)
test_iter = data.DataLoader(mnist_test, shuffle=True, batch_size=batch_size, num_workers=4)

class Accumulator:
    """在`n`个变量上累加。"""
    def __init__(self, n):
        self.data = [0.0] * n

    def add(self, *args):
        self.data = [a + float(b) for a, b in zip(self.data, args)]

    def reset(self):
        self.data = [0.0] * len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

def accuracy(y_hat, y):
    """计算预测正确的数量。"""
    if len(y_hat.shape) > 1 and y_hat.shape[1] > 1:
        y_hat = y_hat.argmax(axis=1)
    cmp = y_hat.type(y.dtype) == y
    return float(cmp.type(y.dtype).sum())

def evaluate_accuracy_gpu(net, data_iter, device=None):
    """使用GPU计算模型在数据集上的精度。"""
    if isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device
    # 正确预测的数量，总预测的数量
    metric = Accumulator(2)
    for X, y in data_iter:
        if isinstance(X, list):
            X = [x.to(device) for x in X]
        else:
            X = X.to(device)
        y = y.to(device)
        metric.add(accuracy(net(X), y), y.numel())
    return metric[0] / metric[1]

def train(net, train_iter, test_iter, num_epochs, lr, device):
    """用GPU训练"""
    def init_weights(m):
      if type(m) == nn.Linear or type(m) == nn.Conv2d:
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    net.to(device)
    optimizer = torch.optim.SGD(net.parameters(), lr=lr)
    loss = nn.CrossEntropyLoss()
    for epoch in range(num_epochs):
        metric = Accumulator(3)
        net.train()
        for i, (X, y) in enumerate(train_iter):
            optimizer.zero_grad()
            X, y = X.to(device), y.to(device)
            y_hat = net(X)
            l = loss(y_hat, y)
            l.backward()
            optimizer.step()
            with torch.no_grad():
                metric.add(l * X.shape[0], accuracy(y_hat, y), X.shape[0])
            train_l = metric[0] / metric[2]
            train_acc = metric[1] / metric[2]
        test_acc = evaluate_accuracy_gpu(net, test_iter)
    print(f'loss {train_l:.3f}, train acc {train_acc:.3f}, '
          f'test acc {test_acc:.3f}')

lr, num_epochs = 0.1, 10
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
train(net, train_iter, test_iter, num_epochs, lr, device)

def get_mnist_labels(labels):
    """返回数字标签。"""
    text_labels = ['0', '1', '2', '3', '4',
                   '5', '6', '7', '8', '9']
    return [text_labels[int(i)] for i in labels]
def show_image(img_tensor):
	"""用于数据集中的显示图片"""
      plt.imshow(img.numpy())
      plt.axis('off')

def predict(net, device=None):
    """预测图片数字"""
    if isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device
    img = cv.imread('./drive/MyDrive/ex/data/MNIST/test.png') # 放预测图片的位置，图片大小为28*28，黑底白字
    img = cv.cvtColor(img, cv.COLOR_RGB2GRAY)
    transf = transforms.ToTensor()
    img_tensor = transf(img)
    show_image(img_tensor)
    pred = get_mnist_labels(net(img_tensor).argmax(axis=1))
    print(pred)

predict(net)

结果

loss:0.046, train accuracy:0.986, test accuracy:0.978

导入下面的预测图片
导入的预测图片

导入的图片显示效果和识别的数字。
结果图片

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

Pytorch

深度学习

人工智能

LeNet-5识别数字的相关文章

PyTorch 中的截断反向传播（代码检查）

我正在尝试在 PyTorch 中实现随时间截断的反向传播对于以下简单情况K1 K2 我下面有一个实现可以产生合理的输出但我只是想确保它是正确的当我在网上查找 TBTT 的 PyTorch 示例时它们在分离隐藏状态将梯度归零以及这些
PyTorch：tensor.cuda（）和tensor.to（torch.device（“cuda：0”））之间有什么区别？

在 PyTorch 中以下两种将张量或模型发送到 GPU 的方法有什么区别 Setup X np array 1 3 2 3 2 3 5 6 1 2 3 4 X model X torch DoubleTensor X Method
如何检查 PyTorch 是否正在使用 GPU？

如何检查 PyTorch 是否正在使用 GPU 这nvidia smi命令可以检测 GPU 活动但我想直接从 Python 脚本内部检查它这些功能应该有助于 gt gt gt import torch gt gt gt torch cu
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
为什么测试时一定要用DataParallel？

在GPU上训练 num gpus设置为1 device ids list range num gpus model NestedUNet opt num channel 2 to device model nn DataParallel m
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
torch-1.1.0-cp37-cp37m-win_amd64.whl 在此平台上不受支持的滚轮

我在开发 RNN 时需要使用 pyTorch 每当我尝试安装它时我都会收到一条错误消息指出 torch 1 1 0 cp37 cp37m win amd32 whl 在此平台上不受支持 pip3安装https download pyto
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
使用 KL 散度时，变分自动编码器为每个输入 mnist 图像提供相同的输出图像

当不使用 KL 散度项时 VAE 几乎完美地重建 mnist 图像但在提供随机噪声时无法正确生成新图像当使用 KL 散度项时 VAE 在重建和生成图像时都会给出相同的奇怪输出这是损失函数的 pytorch 代码 def loss fu
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
pytorch 中的 autograd 可以处理同一模块中层的重复使用吗？

我有一层layer in an nn Module并在一次中使用两次或多次forward步这个的输出layer稍后输入到相同的layer pytorch可以吗autograd正确计算该层权重的梯度 def forward x x self
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
样本（）和r样本（）有什么区别？

当我从 PyTorch 中的发行版中采样时两者sample and rsample似乎给出了类似的结果 import torch seaborn as sns x torch distributions Normal torch tens
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee

随机推荐

C++不定参数，模板函数，模板类详解附实例

前言在 C 中有时我们在写一个函数时并不知道参数的数量和类型这时需要用到不定参数模板函数正文不定参数不定参数怎么表示对于不定参数的表示就是三个点注意是英文的点那么我们在正常使用时函数参数写成这样 funtionType
Python 容器序列切片

视频版教程 Python3零基础7天入门实战视频教程序列是指内容连续且有序的一类数据容器前面学的列表元组字符串都是序列并且支持下标索引切片是指从一个序列中取出一个子序列语法序列起始下标结束下标步长返回一个新的序列
短文阅读3：Variational Autoencoders (VAEs)

深度生成网络 VAEs introduction 降维方法 PCA and Autoencoders 降维架构 PCA 问题1 什么是自动编码器autoencoder PCA和Autoencoders之间的关系 Variational Au
【建议收藏】数据库 SQL 入门——数据查询操作（内附演示）

引言在上一节中我们讨论了DML的使用方法本节我们继续开始DQL的学习首先回归一下DQL的基于定义 DQL Data Query Language 数据查询语言用来查询数据库中表的记录在本节中我们主要讨论DQL的用法以及基本语法
计算机视觉之人脸识别(Yale数据集)--HOG和ResNet两种方法实现

1 问题描述在给定Yale数据集上完成以下工作在给定的人脸库中通过算法完成人脸识别算法需要做到能判断出测试的人脸是否属于给定的数据集如果属于需要判断出测试的人脸属于数据集中的哪一位否则需要声明测试的人脸不属于数据集这是一个
思维导图函数
PCL点云处理之最小二乘空间直线拟合（3D）（二百零二）

PCL点云处理之最小二乘空间直线拟合 3D 二百零二一算法简介二实现代码三效果展示一算法简介对于空间中的这样一组点大致呈直线分布散乱分布在直线左右我们可采用最小二乘方法拟合直线更进一步地可以通过点到直线的投影最
5款程序员必备的免费在线画图工具，超级好用！

点击上方芋道源码选择设为星标管她前浪还是后浪能浪的浪才是好浪每天 10 33 更新文章每天掉亿点点头发源码精品专栏原创 Java 2021 超神之路很肝中文详细注释的开源项目 RPC 框架 Dubbo 源码解析网
java中的集合基础

集合介绍集合类的特点提供一种存储空间可变的存储模型存储的数据容量可以发生改变集合和数组的区别共同点都是存储数据的容器不同点数组的容量是固定的集合的容量是可变的数组可以存基本数据类型和引用数据类型集合只能存引用数据类型
【Android进阶篇】WebView显示网页详解

概述 WebView是Android用于显示网页的控件通过WebView 我们可以查看本地的网页也可以查看网络资源本文内容如下一加载本地网页二加载网络资源三在WebView中使用JavaScript和CSS 四 WebCh
多线程案例(1) - 单例模式

目录单例模式饿汉模式懒汉模式前言多线程中有许多非常经典的设计模式这就类似于围棋的棋谱这是用来解决我们在开发中遇到很多经典场景简单来说设计模式就是一份模板可以套用单例模式顾名思义就是一个程序只能含有一个实例有的场
Permission denied

Permission denied 出现的原因的是没有权限进行读写创建文件删除文件等操作解决方法输入命令 sudo chmod R 777 工作目录例如 sudo chmode R 777 home HDD 此时就可以在该路径
poium测试库介绍

poium测试库前身为selenium page objects测试库我在以前的文章中也有介绍过这可能是最简单的Page Object库项目的核心是基于Page Objects实现元素定位的封装该项目由我个人在维护目前在公司项目中
使用ChatGPT的方式与在其他地方使用它的方式基本相同。以下是一些步骤：

在中国使用ChatGPT的方式与在其他地方使用它的方式基本相同以下是一些步骤访问OpenAI的官方网站 OpenAI 在网站上找到GPT 3或ChatGPT的相关信息 OpenAI提供了详细的API文档可以帮助你理解如何使用它们你需
mysql数据库之跨表复制

背景说明目标库 target db 目标数据表 target tb 将目标库的制定表复制到当前数据库中包括一下几个方面一表结构复制仅仅复制了表的结构没有数据 create table current db new tb like
Logitech G系鼠标脚本编程，实现鼠标自动定位控制

利用罗技官方提供的API来写一个鼠标自动定位移动脚本点击脚本编辑器中的帮助选项查看罗技官方提供的API说明有很多实现好的鼠标功能 G series Lua API V8 45 Overview and Reference 下面是我写的
深入解析SpringBoot启动原理

1 启动类中的SpringApplication run方法会创建一个SpringApplication的实例并做一些初始化工作 SpringBootApplication Slf4j public class HuotuUserServ
Linux C编程基础：获取时间

1 前言对于linux下的编程无论是用户态还是内核态时间获取都是经常需要使用到的以下分别从用户态和内核态整理了几个常用的时间获取接口供编写代码时快速查阅 linux时间子系统的发展历史及详细介绍可以参考深入理解Linux时间子
stm32 机械周期_STM32定时器周期计算

STM32定时器周期计算公式是 1 TIM Prescaler 时钟 1 TIM Period F103配置生成1ms的时钟 1 35 36M 1 999 1MS TIM TimeBaseInitTypeDef TIM TimeBaseS
LeNet-5识别数字

LeNet识别数字前言环境实现结果前言实现经典卷积神经网络LeNet LeNet 5 识别数字这里将激活函数从sigmoid换成ReLU 参考资料动手学深度学习环境 python pytorch 实现 import tor

LeNet-5识别数字

LeNet识别数字

前言

环境

实现

结果

LeNet-5识别数字 的相关文章

随机推荐

热门标签

LeNet-5识别数字的相关文章