PyTorch 手把手搭建神经网络 (MNIST)

2023-11-13

推荐下我自己建的Python学习群:[856833272]，群里都是学Python的，如果你想学或者正在学习Python ，欢迎你加入，大家都是软件开发党，不定期分享干货，还有免费直播课程领取。包括我自己整理的一份2021最新的Python进阶资料和零基础教学，欢迎进阶中和对Python感兴趣的小伙伴加入！还可以扫码加VX领取资料哦！

数据集介绍

本文使用的是PyTorch自带的MNIST数据集，该数据集中为PIL Image，size=28x28。数据存储形式为(data, target)，其中data为PIL Image，target该图片表示的数字。如下所示：

(<PIL.Image.Image image mode=L size=28x28 at 0x175EF44F160>, 5)

模型搭建

PyTorch 手把手搭建神经网络 (MNIST)

input：torch.Size([64, 1, 28, 28])
after conv1: torch.Size([64, 32, 26, 26])
after conv2: torch.Size([64, 64, 24, 24])
after max_pool2d: torch.Size([64, 64, 12, 12])
after flatten: torch.Size([64, 9216])
after fc1: torch.Size([64, 128])
after fc2: torch.Size([64, 10])
after log_softmax: torch.Size([64, 10])

由各层的输出结果可以看出，batch_size为64，网络结构图中tensor在各层的变化与输出一致。

2.1 导入库文件

from __future__ import print_function

import argparse

import torch

import torch.nn as nn

import torch.nn.functional as F

import torch.optim as optim

from torchvision import datasets, transforms

from torch.optim.lr_scheduler import StepLR

2.2 网络结构定义

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.conv1 = nn.Conv2d(1, 32, 3, 1)

        self.conv2 = nn.Conv2d(32, 64, 3, 1)

        self.dropout1 = nn.Dropout(0.25)

        self.dropout2 = nn.Dropout(0.5)

        self.fc1 = nn.Linear(9216, 128)

        self.fc2 = nn.Linear(128, 10)




    def forward(self, x):

        x = self.conv1(x)

        # print("after conv1: {}".format(x.shape))

        x = F.relu(x)

        x = self.conv2(x)

        # print("after conv2: {}".format(x.shape))

        x = F.relu(x)

        x = F.max_pool2d(x, 2)

        # print("after max_pool2d: {}".format(x.shape))

        x = self.dropout1(x)

        x = torch.flatten(x, 1)

        # print("after flatten: {}".format(x.shape))

        x = self.fc1(x)

        # print("after fc1: {}".format(x.shape))

        x = F.relu(x)

        x = self.dropout2(x)

        x = self.fc2(x)

        # print("after fc2: {}".format(x.shape))

        output = F.log_softmax(x, dim=1)

        # print("after log_softmax: {}".format(output.shape))

        return output

2.3 transform究竟是干什么的？

相信大家在读取数据集的时候，经常见到下面这段代码

transform = transforms.Compose([

        transforms.ToTensor(),

        transforms.Normalize((0.1307,), (0.3081,))

        ])

别着急，我们一个个来看，首先看transforms.ToTensor()

PyTorch 手把手搭建神经网络 (MNIST)

简单来说，就是把PIL Image或者 numpy.ndarray类型的数据转化为张量tensor。原来的在[0, 255]的具有(HxWxC)形式的PIL Image或numpy.ndarray数据，被转换为[0.0, 1.0]范围并且shape变为(CxHxW)。

前面我们看到数据集的格式为PIL Image，这个函数就是将之前的PIL Image变为tensor，后续才可以对其进行一系列操作。

再看transforms.Normalize()

PyTorch 手把手搭建神经网络 (MNIST)

对一个tensor进行归一化，传入的两个参数为元组形式，分别为mean和std

PyTorch 手把手搭建神经网络 (MNIST)

相当于一个容器，将若干个transforms组合到一起。

2.4 DataLoader

taet1 = datasets.MNIST('../data', train=True, download=True,

                   transform=transform)

train_loader = torch.utils.data.DataLoader(dataset1, **train_kwargs)

简而言之，DataLoader的作用就是对传入的数据集进行采样sample，返回一个可迭代的对象。注意到前面定义的batch_size为64，那么在这里，每次返回的可迭代对象的size就是64。

2.5 优化器定义

# 优化器

optimizer = optim.Adadelta(model.parameters(), lr=args.lr)




# 调整学习率

scheduler = StepLR(optimizer, step_size=1, gamma=args.gamma)

其中StepLR是用来调整学习率的，具体的调整策略本文暂且不讨论，在之后的博文中对集中调整学习率的方法统一讨论。在这里只需知道随着epoch的增加，learning rate会改变即可。

train

train的流程非常简单，首先设置为train模式，分批次读入数据，优化器梯度置零，数据通过网络，计算损失，反向传播，权重更新。如下

def train(args, model, device, train_loader, optimizer, epoch):

    # 设置为train模式

    model.train()

    # 分批次读入数据

    for batch_idx, (data, target) in enumerate(train_loader):

        data, target = data.to(device), target.to(device)

        # 优化器梯度置零

        optimizer.zero_grad()

        # 数据通过网络

        output = model(data)

        # 计算损失

        loss = F.nll_loss(output, target)

        # 反向传播

        loss.backward()

        # 权重更新

        optimizer.step()

        if batch_idx % args.log_interval == 0:

            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(

                epoch, batch_idx * len(data), len(train_loader.dataset),

                100. * batch_idx / len(train_loader), loss.item()))

            if args.dry_run:

                break

test

test的流程与train略有不同，首先要设置为test模式，这是要防止改变已训练好的权重。接着在with torch.no_grad()中让数据通过网络，计算损失和预测是否正确即可。如下

def test(model, device, test_loader):

    # 设置为test模式

    model.eval()

    test_loss = 0

    correct = 0

    # 不进行计算图的构建，即没有grad_fn属性

    with torch.no_grad():

        for data, target in test_loader:

            data, target = data.to(device), target.to(device)

            output = model(data)

            test_loss += F.nll_loss(output, target, reduction='sum').item()  # sum up batch loss

            pred = output.argmax(dim=1, keepdim=True)  # get the index of the max log-probability

            correct += pred.eq(target.view_as(pred)).sum().item()




    test_loss /= len(test_loader.dataset)




    print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(

        test_loss, correct, len(test_loader.dataset),

        100. * correct / len(test_loader.dataset)))

集成训练测试


def main():
    # Training settings
    # 声明一个parser
    parser = argparse.ArgumentParser(description='PyTorch MNIST Example')

    # 添加参数
    parser.add_argument('--batch-size', type=int, default=64, metavar='N',
                        help='input batch size for training (default: 64)')
    parser.add_argument('--test-batch-size', type=int, default=1000, metavar='N',
                        help='input batch size for testing (default: 1000)')
    parser.add_argument('--epochs', type=int, default=14, metavar='N',
                        help='number of epochs to train (default: 14)')
    parser.add_argument('--lr', type=float, default=1.0, metavar='LR',
                        help='learning rate (default: 1.0)')
    parser.add_argument('--gamma', type=float, default=0.7, metavar='M',
                        help='Learning rate step gamma (default: 0.7)')
    parser.add_argument('--no-cuda', action='store_true', default=False,
                        help='disables CUDA training')
    parser.add_argument('--dry-run', action='store_true', default=False,
                        help='quickly check a single pass')
    parser.add_argument('--seed', type=int, default=1, metavar='S',
                        help='random seed (default: 1)')
    parser.add_argument('--log-interval', type=int, default=10, metavar='N',
                        help='how many batches to wait before logging training status')
    parser.add_argument('--save-model', action='store_true', default=False,
                        help='For Saving the current Model')

    # 读取命令行参数
    args = parser.parse_args()
    use_cuda = not args.no_cuda and torch.cuda.is_available()

    torch.manual_seed(args.seed)

    device = torch.device("cuda" if use_cuda else "cpu")

    train_kwargs = {'batch_size': args.batch_size}
    test_kwargs = {'batch_size': args.test_batch_size}
    if use_cuda:
        cuda_kwargs = {'num_workers': 1,
                       'pin_memory': True,
                       'shuffle': True}
        train_kwargs.update(cuda_kwargs)
        test_kwargs.update(cuda_kwargs)

    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
        ])
    dataset1 = datasets.MNIST('../data', train=True, download=True,
                       transform=transform)
    dataset2 = datasets.MNIST('../data', train=False,
                       transform=transform)
    train_loader = torch.utils.data.DataLoader(dataset1, **train_kwargs)
    test_loader = torch.utils.data.DataLoader(dataset2, **test_kwargs)

    model = Net().to(device)
    optimizer = optim.Adadelta(model.parameters(), lr=args.lr)

    scheduler = StepLR(optimizer, step_size=1, gamma=args.gamma)
    for epoch in range(1, args.epochs + 1):
        train(args, model, device, train_loader, optimizer, epoch)
        test(model, device, test_loader)
        scheduler.step()

    if args.save_model:
        torch.save(model.state_dict(), "mnist_cnn.pt")

模型结果

PyTorch 手把手搭建神经网络 (MNIST)

摸鱼建议

摸鱼也是最近接触PyTorch这个框架，在学习过程中遇到了一些问题，也总结了一些经验。下面是摸鱼遇到的一些问题以及解决方式

Q1：为什么网络的结构是这样定义的？有什么理由吗？

A1：其实刚开始摸鱼也不清楚为什么网络要这样设计，后来在Andrew Ng的课上，老师提起过一嘴，说这个没有什么特别的原因，如果非要说一个原因的话那就是它在实验上的表现很好。所以我们在学习的过程中，可以借鉴那些经典的网络结构，以此为基础改进来形成我们自己的网络架构。同样网络中的参数也是一般采用设计者给出的会比较好。

Q2：transform，DataLoader等等的到底是干嘛的？在好多地方看到过但还是比较模糊

A2：确实，在看官方文档的时候，经常看到这两段代码。相信看完本文应该就可以解决这个问题了，至于要如何解决类似的问题，我的一个建议是了解数据的源格式以及你想要的的目的格式。其实transform不难理解，就是进行一个数据格式的转换，但是如果不了解数据的源格式，可能对这块就会比较模糊。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

PyTorch 手把手搭建神经网络 (MNIST) 的相关文章

检查 PyTorch 张量在 epsilon 内是否相等

如何检查两个 PyTorch 张量在语义上是否相等考虑到浮点错误我想知道元素是否仅相差一个小的 epsilon 值在撰写本文时这是最新稳定版本 0 4 1 中的一个未记录的函数但文档位于master unstable branch
PyTorch 中的截断反向传播（代码检查）

我正在尝试在 PyTorch 中实现随时间截断的反向传播对于以下简单情况K1 K2 我下面有一个实现可以产生合理的输出但我只是想确保它是正确的当我在网上查找 TBTT 的 PyTorch 示例时它们在分离隐藏状态将梯度归零以及这些
用我自己的值初始化pytorch卷积层

我想知道是否有办法用我自己的值初始化 pytorch 卷积过滤器例如我有一个元组 0 8423 0 3778 3 1070 2 6518 我想用这些值初始化 2X2 过滤器我该怎么做我查找了一些答案但他们大多使用火炬正态分布和其他
PyTorch - 参数不变

为了了解 pytorch 的工作原理我尝试对多元正态分布中的一些参数进行最大似然估计然而它似乎不适用于任何协方差相关的参数所以我的问题是为什么这段代码不起作用 import torch def make covariance ma
Cuda和pytorch内存使用情况

我在用Cuda and Pytorch 1 4 0 当我尝试增加batch size 我遇到以下错误 CUDA out of memory Tried to allocate 20 00 MiB GPU 0 4 00 GiB total c
二维数组的按行 numpy.isin [重复]

这个问题在这里已经有答案了我有两个数组 A np array 3 1 4 1 1 4 B np array 0 1 5 2 4 5 2 3 5 是否可以使用numpy isin二维数组按行排列我想检查一下是否A i j is in B
运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
pytorch grad 在 .backward() 之后为 None

我刚刚安装火炬 1 0 0 on Python 3 7 2 macOS 并尝试tutorial https pytorch org tutorials beginner blitz autograd tutorial html sphx g
如何平衡 GAN 中生成器和判别器的性能？

这是我第一次使用 GAN 我面临着判别器多次优于生成器的问题我正在尝试重现PA模型来自本文 http openaccess thecvf com content ICCV 2017 papers Sajjadi EnhanceNet Si
为什么我在这里遇到被零除的错误？

所以我正在关注这个文档中的教程 https pytorch org tutorials beginner data loading tutorial html在自定义数据集上我使用的是 MNIST 数据集而不是教程中的奇特数据集这是D
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
为什么 RNN 需要两个偏置向量？

In Pytorch RNN 实现 http pytorch org docs master nn html highlight rnn torch nn RNN 有两个偏差 b ih and b hh 为什么是这样它与使用一种偏差有什么
PyTorch LSTM：运行时错误：无效参数 0：张量的大小必须匹配，维度 0 除外。维度 1 为 1219 和 440

我有一个基本的 PyTorch LSTM import torch nn as nn import torch nn functional as F class BaselineLSTM nn Module def init self su
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
如何使用 pytorch 同时迭代两个数据加载器？

我正在尝试实现一个接收两张图像的暹罗网络我加载这些图像并创建两个单独的数据加载器在我的循环中我想同时遍历两个数据加载器以便我可以在两个图像上训练网络 for i data in enumerate zip dataloaders1
在Pytorch中计算欧几里得范数..理解和实现上的麻烦

我见过另一个 StackOverflow 线程讨论计算欧几里德范数的各种实现但我很难理解特定实现的原因如何工作该代码可以在 MMD 指标的实现中找到 https github com josipd torch two sample b
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T

随机推荐

qemu模拟器搭建arm运行环境搭建笔记

qemu system arm M vexpress a9 m 512M kernel home lyk Downloads qemu linux 3 16 arch arm boot zImage nographic append roo
SD2.0软件大会纪实 - 个人观感

12月9日 10日 SD2 0大会在上海光大会展中心国际大酒店举行有幸参加这场盛会将这两天的所得分享一下以下文字是通过回忆并参考了CSDN网站的报道整理出来的 9日是全体大会上午Keynote基本上是个广告的集合 CSDN给自己的各
算法导论随笔(十五)：线性规划与单纯形算法（上篇：基本概念）

线性规划 Linear Programming 问题指的是在给定有限资源的前提下最大化或最小化某个目标的问题这里我将分上下两篇来谈谈线性规划和单纯形算法前言线性规划问题有很多例子比如在算法导论随笔六贪心算法Greedy alg
MSRA实习记

文章目录前言时间线实习生集体办公楼工作环境饮食娱乐活动薪酬待遇住宿总结前言我是哈工大2018级本科生由于大三课程枯燥选择到北京实习偶然看到了诗昭姐的招聘启事幸运地获得了她的认可获得了人生第一份实习加入了D
Excel分割字符串

在数据处理中我们经常会遇到分割字符的情况比如读取csv文件 Excel提供了可视化的字符串分割方法 1 按分隔符分割字符串 2 选择用逗号分割 3 结果如图
自动化运维---ansible常用模块之文件操作（file&blockinfile&lineinfile模块）

自动化运维 ansible常用模块之文件操作 file blockinfile lineinfile模块文章目录自动化运维 ansible常用模块之文件操作 file blockinfile lineinfile模块 1 file模块
7. QML类中对象树的创建和销毁顺序是这样的

简述有下面一段代码通常会有需求在Component onCompleted信号之后做一些初始化操作那这些组件初始化完成的顺序是怎样的同时有创建完成的信号也有对应销毁完成的信号类似C 中的构造和析构函数但我们这里叫信号处理程序
java三种分页查询的方式

第一种分页需要查询出总数第二种分页如果是以id为主键并且是递增的情况第三种直接用do while进行分页查询不需要查询总个数和最大最小值 mybatis plus分页第四种分页 for循环分页
Vue指令学习

目录 v text 设置标签的内容 v html 设置元素的innerHTML v on 为元素绑定事件 v show 根据布尔值控制元素的样式为显示或隐藏 v if 根据布尔值控制dom为显示或隐藏 v bind 在vue中为元素绑定属性
SQLite 如何在Windows下编译?

SQLite 如何在Windows下编译发表时间 2007 6 13 12 44 00 评论打印字体大中小本文链接 http blog pfan cn lounger 26745 html 复制链接分享到 0 标签 C C
计算机中￥符号按哪个键,电脑键盘符号快捷键大全电脑键盘上每个键的作用？...

电脑键盘符号快捷键大全电脑键盘符号怎么打很多朋友还不太清楚电脑的各个符号要怎么打快捷键是什么呢那么下面就一起来看看电脑键盘符号大全吧电脑键盘符号怎么打电脑键盘符号大全常见的标点符号分号书名号双引号单引号破折号竖线
sublime简用

1 使用goto anything 快速查询各种文件可以快速定位CSS中选择器或JavaScript中的function 2 其中的输入时选取简化的输入则可 bgc就代表background color 3 多行游标光标放在单词中然
hashmap为什么8转成红黑树_深入分析HashMap的红黑树实现方式

在分析jdk1 8的HashMap实现原理之前咱们先可以了解一下红黑树的设计相比jdk1 7的HashMap而言 jdk1 8最重要的就是引入了红黑树的设计当冲突的链表长度超过8个的时候链表结构就会转为红黑树结构 01 故事的起因
Mysql——压缩包方式安装教程

一 Mysql压缩包下载方式 zip版 5 7及8 0 的下载需到官方网站下载不同版本对应能安装在不同的操作系统下本次介绍的是mysql 8 0 30 winx64在win10下的安装方式下载网址 MySQL Download MyS
android模拟器与宿主机通讯

android模拟器与PC的端口映射一概述 Android系统为实现通信将PC电脑IP设置为10 0 2 2 自身设置为127 0 0 1 而PC并没有为Android模拟器系统指定IP 所以PC电脑不能通过IP来直接访问Android
Mysql增强半同步模式_MySQL增强半同步的搭建实验，和一些参数的个人理解

环境信息 role ip port hostname master 192 168 188 101 4306 mysqlvm1 slave 192 168 188 201 4306 mysqlvm1 1 5306 6306 7306 MyS
eclipse搜索类快捷键

习惯的编辑器可以提高编程效率熟悉的快捷键可以提高工作效率本文更新eclipse中常用的搜索快捷键打开资源快捷键 Ctrl Shift R 通过在搜索框中输入名字可以很方便的在项目或工作空间中找某个文件支持模糊查询功能例如输入文件的
Linux防火墙

关于linux系统防火墙 centos5 centos6 redhat6系统自带的是iptables防火墙 centos7 redhat7自带firewall防火墙 ubuntu系统使用的是ufw防火墙必要操作 linux系统防火墙开放相
AOP之5种增强方法应用范例

林炳文Evankaka原创作品转载请注明出处http blog csdn net evankaka Spring AOP 提供了 5 种类型的通知它们分别是 Before Advice 前置通知 After Returning Advi
PyTorch 手把手搭建神经网络 (MNIST)

推荐下我自己建的Python学习群 856833272 群里都是学Python的如果你想学或者正在学习Python 欢迎你加入大家都是软件开发党不定期分享干货还有免费直播课程领取包括我自己整理的一份2021最新的Python进阶资

PyTorch 手把手搭建神经网络 (MNIST)

PyTorch 手把手搭建神经网络 (MNIST) 的相关文章

随机推荐

热门标签