PyTorch 手把手搭建神经网络 (MNIST)

2023-11-13

推荐下我自己建的Python学习群:[856833272],群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货,还有免费直播课程领取。包括我自己整理的一份2021最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!还可以扫码加VX领取资料哦!


 

 

01

数据集介绍

本文使用的是PyTorch自带的MNIST数据集,该数据集中为PIL Image,size=28x28。数据存储形式为(data, target),其中data为PIL Image,target该图片表示的数字。如下所示:

(<PIL.Image.Image image mode=L size=28x28 at 0x175EF44F160>, 5)

02

模型搭建

PyTorch 手把手搭建神经网络 (MNIST)

  • input:torch.Size([64, 1, 28, 28])
  • after conv1: torch.Size([64, 32, 26, 26])
  • after conv2: torch.Size([64, 64, 24, 24])
  • after max_pool2d: torch.Size([64, 64, 12, 12])
  • after flatten: torch.Size([64, 9216])
  • after fc1: torch.Size([64, 128])
  • after fc2: torch.Size([64, 10])
  • after log_softmax: torch.Size([64, 10])

由各层的输出结果可以看出,batch_size为64,网络结构图中tensor在各层的变化与输出一致。

2.1 导入库文件

from __future__ import print_function

import argparse

import torch

import torch.nn as nn

import torch.nn.functional as F

import torch.optim as optim

from torchvision import datasets, transforms

from torch.optim.lr_scheduler import StepLR

2.2 网络结构定义

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.conv1 = nn.Conv2d(1, 32, 3, 1)

        self.conv2 = nn.Conv2d(32, 64, 3, 1)

        self.dropout1 = nn.Dropout(0.25)

        self.dropout2 = nn.Dropout(0.5)

        self.fc1 = nn.Linear(9216, 128)

        self.fc2 = nn.Linear(128, 10)




    def forward(self, x):

        x = self.conv1(x)

        # print("after conv1: {}".format(x.shape))

        x = F.relu(x)

        x = self.conv2(x)

        # print("after conv2: {}".format(x.shape))

        x = F.relu(x)

        x = F.max_pool2d(x, 2)

        # print("after max_pool2d: {}".format(x.shape))

        x = self.dropout1(x)

        x = torch.flatten(x, 1)

        # print("after flatten: {}".format(x.shape))

        x = self.fc1(x)

        # print("after fc1: {}".format(x.shape))

        x = F.relu(x)

        x = self.dropout2(x)

        x = self.fc2(x)

        # print("after fc2: {}".format(x.shape))

        output = F.log_softmax(x, dim=1)

        # print("after log_softmax: {}".format(output.shape))

        return output

2.3 transform究竟是干什么的?

相信大家在读取数据集的时候,经常见到下面这段代码

transform = transforms.Compose([

        transforms.ToTensor(),

        transforms.Normalize((0.1307,), (0.3081,))

        ])

别着急,我们一个个来看,首先看transforms.ToTensor()

PyTorch 手把手搭建神经网络 (MNIST)

简单来说,就是把PIL Image或者 numpy.ndarray类型的数据转化为张量tensor。原来的在[0, 255]的具有(HxWxC)形式的PIL Image或numpy.ndarray数据,被转换为[0.0, 1.0]范围并且shape变为(CxHxW)。

前面我们看到数据集的格式为PIL Image,这个函数就是将之前的PIL Image变为tensor,后续才可以对其进行一系列操作。

再看transforms.Normalize()

PyTorch 手把手搭建神经网络 (MNIST)

对一个tensor进行归一化,传入的两个参数为元组形式,分别为mean和std

PyTorch 手把手搭建神经网络 (MNIST)

相当于一个容器,将若干个transforms组合到一起。

2.4 DataLoader

taet1 = datasets.MNIST('../data', train=True, download=True,

                   transform=transform)

train_loader = torch.utils.data.DataLoader(dataset1, **train_kwargs)

简而言之,DataLoader的作用就是对传入的数据集进行采样sample,返回一个可迭代的对象。注意到前面定义的batch_size为64,那么在这里,每次返回的可迭代对象的size就是64。

2.5 优化器定义

# 优化器

optimizer = optim.Adadelta(model.parameters(), lr=args.lr)




# 调整学习率

scheduler = StepLR(optimizer, step_size=1, gamma=args.gamma)

其中StepLR是用来调整学习率的,具体的调整策略本文暂且不讨论,在之后的博文中对集中调整学习率的方法统一讨论。在这里只需知道随着epoch的增加,learning rate会改变即可。

03

train

train的流程非常简单,首先设置为train模式,分批次读入数据,优化器梯度置零,数据通过网络,计算损失,反向传播,权重更新。如下

def train(args, model, device, train_loader, optimizer, epoch):

    # 设置为train模式

    model.train()

    # 分批次读入数据

    for batch_idx, (data, target) in enumerate(train_loader):

        data, target = data.to(device), target.to(device)

        # 优化器梯度置零

        optimizer.zero_grad()

        # 数据通过网络

        output = model(data)

        # 计算损失

        loss = F.nll_loss(output, target)

        # 反向传播

        loss.backward()

        # 权重更新

        optimizer.step()

        if batch_idx % args.log_interval == 0:

            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(

                epoch, batch_idx * len(data), len(train_loader.dataset),

                100. * batch_idx / len(train_loader), loss.item()))

            if args.dry_run:

                break

04

test

test的流程与train略有不同,首先要设置为test模式,这是要防止改变已训练好的权重。接着在with torch.no_grad()中让数据通过网络,计算损失和预测是否正确即可。如下

def test(model, device, test_loader):

    # 设置为test模式

    model.eval()

    test_loss = 0

    correct = 0

    # 不进行计算图的构建,即没有grad_fn属性

    with torch.no_grad():

        for data, target in test_loader:

            data, target = data.to(device), target.to(device)

            output = model(data)

            test_loss += F.nll_loss(output, target, reduction='sum').item()  # sum up batch loss

            pred = output.argmax(dim=1, keepdim=True)  # get the index of the max log-probability

            correct += pred.eq(target.view_as(pred)).sum().item()




    test_loss /= len(test_loader.dataset)




    print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(

        test_loss, correct, len(test_loader.dataset),

        100. * correct / len(test_loader.dataset)))

05

集成训练测试


def main():
    # Training settings
    # 声明一个parser
    parser = argparse.ArgumentParser(description='PyTorch MNIST Example')

    # 添加参数
    parser.add_argument('--batch-size', type=int, default=64, metavar='N',
                        help='input batch size for training (default: 64)')
    parser.add_argument('--test-batch-size', type=int, default=1000, metavar='N',
                        help='input batch size for testing (default: 1000)')
    parser.add_argument('--epochs', type=int, default=14, metavar='N',
                        help='number of epochs to train (default: 14)')
    parser.add_argument('--lr', type=float, default=1.0, metavar='LR',
                        help='learning rate (default: 1.0)')
    parser.add_argument('--gamma', type=float, default=0.7, metavar='M',
                        help='Learning rate step gamma (default: 0.7)')
    parser.add_argument('--no-cuda', action='store_true', default=False,
                        help='disables CUDA training')
    parser.add_argument('--dry-run', action='store_true', default=False,
                        help='quickly check a single pass')
    parser.add_argument('--seed', type=int, default=1, metavar='S',
                        help='random seed (default: 1)')
    parser.add_argument('--log-interval', type=int, default=10, metavar='N',
                        help='how many batches to wait before logging training status')
    parser.add_argument('--save-model', action='store_true', default=False,
                        help='For Saving the current Model')

    # 读取命令行参数
    args = parser.parse_args()
    use_cuda = not args.no_cuda and torch.cuda.is_available()

    torch.manual_seed(args.seed)

    device = torch.device("cuda" if use_cuda else "cpu")

    train_kwargs = {'batch_size': args.batch_size}
    test_kwargs = {'batch_size': args.test_batch_size}
    if use_cuda:
        cuda_kwargs = {'num_workers': 1,
                       'pin_memory': True,
                       'shuffle': True}
        train_kwargs.update(cuda_kwargs)
        test_kwargs.update(cuda_kwargs)

    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
        ])
    dataset1 = datasets.MNIST('../data', train=True, download=True,
                       transform=transform)
    dataset2 = datasets.MNIST('../data', train=False,
                       transform=transform)
    train_loader = torch.utils.data.DataLoader(dataset1, **train_kwargs)
    test_loader = torch.utils.data.DataLoader(dataset2, **test_kwargs)

    model = Net().to(device)
    optimizer = optim.Adadelta(model.parameters(), lr=args.lr)

    scheduler = StepLR(optimizer, step_size=1, gamma=args.gamma)
    for epoch in range(1, args.epochs + 1):
        train(args, model, device, train_loader, optimizer, epoch)
        test(model, device, test_loader)
        scheduler.step()

    if args.save_model:
        torch.save(model.state_dict(), "mnist_cnn.pt")

06

模型结果

PyTorch 手把手搭建神经网络 (MNIST)

07

摸鱼建议

摸鱼也是最近接触PyTorch这个框架,在学习过程中遇到了一些问题,也总结了一些经验。下面是摸鱼遇到的一些问题以及解决方式

Q1:为什么网络的结构是这样定义的?有什么理由吗?

A1:其实刚开始摸鱼也不清楚为什么网络要这样设计,后来在Andrew Ng的课上,老师提起过一嘴,说这个没有什么特别的原因,如果非要说一个原因的话那就是它在实验上的表现很好。所以我们在学习的过程中,可以借鉴那些经典的网络结构,以此为基础改进来形成我们自己的网络架构。同样网络中的参数也是一般采用设计者给出的会比较好。

Q2:transform,DataLoader等等的到底是干嘛的?在好多地方看到过但还是比较模糊

A2:确实,在看官方文档的时候,经常看到这两段代码。相信看完本文应该就可以解决这个问题了,至于要如何解决类似的问题,我的一个建议是了解数据的源格式以及你想要的的目的格式。其实transform不难理解,就是进行一个数据格式的转换,但是如果不了解数据的源格式,可能对这块就会比较模糊。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PyTorch 手把手搭建神经网络 (MNIST) 的相关文章

随机推荐

  • qemu模拟器搭建arm运行环境搭建笔记

    qemu system arm M vexpress a9 m 512M kernel home lyk Downloads qemu linux 3 16 arch arm boot zImage nographic append roo
  • SD2.0软件大会纪实 - 个人观感

    12月9日 10日 SD2 0大会在上海光大会展中心国际大酒店举行 有幸参加这场盛会 将这两天的所得分享一下 以下文字是通过回忆并参考了CSDN网站的报道整理出来的 9日是全体大会 上午Keynote基本上是个广告的集合 CSDN给自己的各
  • 算法导论随笔(十五):线性规划与单纯形算法(上篇:基本概念)

    线性规划 Linear Programming 问题指的是在给定有限资源的前提下 最大化或最小化某个目标的问题 这里我将分上下两篇来谈谈线性规划和单纯形算法 前言 线性规划问题有很多例子 比如在算法导论随笔 六 贪心算法Greedy alg
  • MSRA实习记

    文章目录 前言 时间线 实习生集体 办公楼 工作环境 饮食 娱乐活动 薪酬待遇 住宿 总结 前言 我是哈工大2018级本科生 由于大三课程枯燥 选择到北京实习 偶然看到了诗昭姐的招聘启事 幸运地获得了她的认可 获得了人生第一份实习 加入了D
  • Excel分割字符串

    在数据处理中我们经常会遇到分割字符的情况 比如读取csv文件 Excel提供了可视化的字符串分割方法 1 按分隔符 分割字符串 2 选择用 逗号 分割 3 结果如图
  • 自动化运维---ansible常用模块之文件操作(file&blockinfile&lineinfile模块)

    自动化运维 ansible常用模块之文件操作 file blockinfile lineinfile模块 文章目录 自动化运维 ansible常用模块之文件操作 file blockinfile lineinfile模块 1 file模块
  • 7. QML类中对象树的创建和销毁顺序是这样的

    简述 有下面一段代码 通常会有需求在Component onCompleted信号之后做一些初始化操作 那这些组件初始化完成的顺序是怎样的 同时有创建完成的信号 也有对应销毁完成的信号 类似C 中的构造和析构函数 但我们这里叫信号处理程序
  • java三种分页查询的方式

    第一种 分页 需要查询出总数 第二种分页如果是以id为主键并且是递增的情况 第三种直接用do while进行分页查询 不需要查询总个数和最大最小值 mybatis plus分页 第四种分页 for循环分页
  • Vue指令学习

    目录 v text 设置标签的内容 v html 设置元素的innerHTML v on 为元素绑定事件 v show 根据布尔值控制元素的样式为显示或隐藏 v if 根据布尔值控制dom为显示或隐藏 v bind 在vue中为元素绑定属性
  • SQLite 如何在Windows下编译?

    SQLite 如何在Windows下编译 发表时间 2007 6 13 12 44 00 评论 打印 字体 大 中 小 本文链接 http blog pfan cn lounger 26745 html 复制链接 分享到 0 标签 C C
  • 计算机中¥符号按哪个键,电脑键盘符号快捷键大全 电脑键盘上每个键的作用?...

    电脑键盘符号快捷键大全 电脑键盘符号怎么打 很多朋友还不太清楚电脑的各个符号要怎么打 快捷键是什么呢 那么下面就一起来看看电脑键盘符号大全吧 电脑键盘符号怎么打 电脑键盘符号大全 常见的标点符号 分号 书名号 双引号 单引号 破折号 竖线
  • sublime简用

    1 使用goto anything 快速查询各种文件 可以快速定位CSS中选择器 或JavaScript中的function 2 其中的输入时选取简化的输入则可 bgc就代表background color 3 多行游标 光标放在单词中 然
  • hashmap为什么8转成红黑树_深入分析HashMap的红黑树实现方式

    在分析jdk1 8的HashMap实现原理之前 咱们先可以了解一下红黑树的设计 相比jdk1 7的HashMap而言 jdk1 8最重要的就是引入了红黑树的设计 当冲突的链表长度超过8个的时候 链表结构就会转为红黑树结构 01 故事的起因
  • Mysql——压缩包方式安装教程

    一 Mysql压缩包下载方式 zip版 5 7及8 0 的下载需到官方网站下载 不同版本对应能安装在不同的操作系统下 本次介绍的是mysql 8 0 30 winx64在win10下的安装方式 下载网址 MySQL Download MyS
  • android模拟器与宿主机通讯

    android模拟器与PC的端口映射 一 概述 Android系统为实现通信将PC电脑IP设置为10 0 2 2 自身设置为127 0 0 1 而PC并没有为Android模拟器系统指定IP 所以PC电脑不能通过IP来直接访问Android
  • Mysql增强半同步模式_MySQL增强半同步的搭建实验,和一些参数的个人理解

    环境信息 role ip port hostname master 192 168 188 101 4306 mysqlvm1 slave 192 168 188 201 4306 mysqlvm1 1 5306 6306 7306 MyS
  • eclipse搜索类快捷键

    习惯的编辑器可以提高编程效率 熟悉的快捷键可以提高工作效率 本文更新eclipse中常用的搜索快捷键 打开资源快捷键 Ctrl Shift R 通过在搜索框中输入名字可以很方便的在项目或工作空间中找某个文件 支持模糊查询功能 例如输入文件的
  • Linux防火墙

    关于linux系统防火墙 centos5 centos6 redhat6系统自带的是iptables防火墙 centos7 redhat7自带firewall防火墙 ubuntu系统使用的是ufw防火墙 必要操作 linux系统防火墙开放相
  • AOP之5种增强方法应用范例

    林炳文Evankaka原创作品 转载请注明出处http blog csdn net evankaka Spring AOP 提供了 5 种类型的通知 它们分别是 Before Advice 前置通知 After Returning Advi
  • PyTorch 手把手搭建神经网络 (MNIST)

    推荐下我自己建的Python学习群 856833272 群里都是学Python的 如果你想学或者正在学习Python 欢迎你加入 大家都是软件开发党 不定期分享干货 还有免费直播课程领取 包括我自己整理的一份2021最新的Python进阶资