《动手学深度学习 Pytorch版》 6.6 卷积神经网络

2023-11-02

import torch
from torch import nn
from d2l import torch as d2l

6.6.1 LeNet

LetNet-5 由两个部分组成：

- 卷积编码器：由两个卷积核组成。
- 全连接层稠密块：由三个全连接层组成。

模型结构如下流程图（每个卷积块由一个卷积层、一个 sigmoid 激活函数和平均汇聚层组成）：

全连接层(10)

↑ \uparrow ↑

全连接层(84)

↑ \uparrow ↑

全连接层(120)

↑ \uparrow ↑

2 × 2 2\times2 2×2平均汇聚层，步幅2

↑ \uparrow ↑

5 × 5 5\times5 5×5卷积层(16)

↑ \uparrow ↑

2 × 2 2\times2 2×2平均汇聚层，步幅2

↑ \uparrow ↑

5 × 5 5\times5 5×5卷积层(6)，填充2

↑ \uparrow ↑

输入图像（ 28 × 28 28\times28 28×28 单通道）

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

X = torch.rand(size=(1, 1, 28, 28), dtype=torch.float32)  # 生成测试数据
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape: \t',X.shape)  # 确保模型各层数据正确

Conv2d output shape: 	 torch.Size([1, 6, 28, 28])
Sigmoid output shape: 	 torch.Size([1, 6, 28, 28])
AvgPool2d output shape: 	 torch.Size([1, 6, 14, 14])
Conv2d output shape: 	 torch.Size([1, 16, 10, 10])
Sigmoid output shape: 	 torch.Size([1, 16, 10, 10])
AvgPool2d output shape: 	 torch.Size([1, 16, 5, 5])
Flatten output shape: 	 torch.Size([1, 400])
Linear output shape: 	 torch.Size([1, 120])
Sigmoid output shape: 	 torch.Size([1, 120])
Linear output shape: 	 torch.Size([1, 84])
Sigmoid output shape: 	 torch.Size([1, 84])
Linear output shape: 	 torch.Size([1, 10])

6.6.2 模型训练

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size=batch_size)  # 仍使用经典的 Fashion-MNIST 数据集

def evaluate_accuracy_gpu(net, data_iter, device=None): #@save
    """使用GPU计算模型在数据集上的精度"""
    if isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device
    metric = d2l.Accumulator(2)  # 生成一个有两个元素的列表，使用 add 将会累加到对应的元素上
    with torch.no_grad():
        for X, y in data_iter:
            # 为了使用 GPU，需要将数据移动到 GPU 上
            if isinstance(X, list):
                X = [x.to(device) for x in X]
            else:
                X = X.to(device)
            y = y.to(device)
            metric.add(d2l.accuracy(net(X), y), y.numel())  # 累加（正确预测的数量，总预测的数量）
    return metric[0] / metric[1]  # 正确率

#@save
def train_ch6(net, train_iter, test_iter, num_epochs, lr, device):
    """用GPU训练模型(在第六章定义)"""
    def init_weights(m):  # 使用 Xavier 初始化权重
        if type(m) == nn.Linear or type(m) == nn.Conv2d:
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    print('training on', device)
    net.to(device)  # 移动数据到GPU
    optimizer = torch.optim.SGD(net.parameters(), lr=lr)
    loss = nn.CrossEntropyLoss()
    animator = d2l.Animator(xlabel='epoch', xlim=[1, num_epochs],
                            legend=['train loss', 'train acc', 'test acc'])
    timer, num_batches = d2l.Timer(), len(train_iter)
    for epoch in range(num_epochs):
        # 训练损失之和，训练准确率之和，样本数
        metric = d2l.Accumulator(3)
        net.train()
        for i, (X, y) in enumerate(train_iter):
            timer.start()
            optimizer.zero_grad()
            X, y = X.to(device), y.to(device)
            y_hat = net(X)
            l = loss(y_hat, y)
            l.backward()
            optimizer.step()
            with torch.no_grad():
                metric.add(l * X.shape[0], d2l.accuracy(y_hat, y), X.shape[0])
            timer.stop()
            train_l = metric[0] / metric[2]
            train_acc = metric[1] / metric[2]
            if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:
                animator.add(epoch + (i + 1) / num_batches,
                             (train_l, train_acc, None))
        test_acc = evaluate_accuracy_gpu(net, test_iter)
        animator.add(epoch + 1, (None, None, test_acc))
    print(f'loss {train_l:.3f}, train acc {train_acc:.3f}, '
          f'test acc {test_acc:.3f}')
    print(f'{metric[2] * num_epochs / timer.sum():.1f} examples/sec '
          f'on {str(device)}')

lr, num_epochs = 0.9, 10
train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

loss 0.471, train acc 0.820, test acc 0.815
40056.7 examples/sec on cuda:0

在这里插入图片描述

练习

（1）将平均汇聚层替换为最大汇聚层，会发生什么？

net_Max = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.MaxPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.MaxPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

lr, num_epochs = 0.9, 10
train_ch6(net_Max, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

loss 0.422, train acc 0.844, test acc 0.671
31151.6 examples/sec on cuda:0

在这里插入图片描述

几乎无区别

（2）尝试构建一个基于 LeNet 的更复杂网络，以提高其精准性。

a. 调节卷积窗口的大小。
b. 调整输出通道的数量。
c. 调整激活函数（如 ReLU）。
d. 调整卷积层的数量。
e. 调整全连接层的数量。
f. 调整学习率和其他训练细节（例如，初始化和轮数）。

net_Best = nn.Sequential(
    nn.Conv2d(1, 8, kernel_size=5, padding=2), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(8, 16, kernel_size=3, padding=1), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(16, 32, kernel_size=3, padding=1), nn.ReLU(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(32 * 3 * 3, 128), nn.ReLU(),
    nn.Linear(128, 64), nn.ReLU(),
    nn.Linear(64, 32), nn.ReLU(),
    nn.Linear(32, 10)
)

lr, num_epochs = 0.4, 10
train_ch6(net_Best, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

loss 0.344, train acc 0.869, test acc 0.854
32868.3 examples/sec on cuda:0

在这里插入图片描述

（3）在 MNIST 数据集上尝试以上改进后的网络。

import torchvision
from torch.utils import data
from torchvision import transforms

trans = transforms.ToTensor()
mnist_train = torchvision.datasets.MNIST(
    root="../data", train=True, transform=trans, download=True)
mnist_test = torchvision.datasets.MNIST(
    root="../data", train=False, transform=trans, download=True)
train_iter2 = data.DataLoader(mnist_train, batch_size, shuffle=True,
                             num_workers=d2l.get_dataloader_workers())
test_iter2 = data.DataLoader(mnist_test, batch_size, shuffle=True,
                            num_workers=d2l.get_dataloader_workers())

lr, num_epochs = 0.4, 5  # 大约 6 轮往后直接就爆炸
train_ch6(net_Best, train_iter2, test_iter2, num_epochs, lr, d2l.try_gpu())

loss 0.049, train acc 0.985, test acc 0.986
26531.1 examples/sec on cuda:0

在这里插入图片描述

（4）显示不同输入（例如，毛衣和外套）时 LetNet 第一层和第二层的激活值。

for X, y in test_iter:
        break

x_first_Sigmoid_layer = net[0:2](X)[0:9, 1, :, :]
d2l.show_images(x_first_Sigmoid_layer.reshape(9, 28, 28).cpu().detach(), 1, 9)
x_second_Sigmoid_layer = net[0:5](X)[0:9, 1, :, :]
d2l.show_images(x_second_Sigmoid_layer.reshape(9, 10, 10).cpu().detach(), 1, 9)
d2l.plt.show()

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

《动手学深度学习 Pytorch版》学习笔记

深度学习

Pytorch

cnn

《动手学深度学习 Pytorch版》 6.6 卷积神经网络的相关文章

二维数组的按行 numpy.isin [重复]

这个问题在这里已经有答案了我有两个数组 A np array 3 1 4 1 1 4 B np array 0 1 5 2 4 5 2 3 5 是否可以使用numpy isin二维数组按行排列我想检查一下是否A i j is in B
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
查找张量中沿轴的非零元素的数量

我想找到沿特定轴的张量中非零元素的数量有没有 PyTorch 函数可以做到这一点我尝试使用非零 http pytorch org docs master torch html highlight nonzero torch nonzer
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
如何平衡 GAN 中生成器和判别器的性能？

这是我第一次使用 GAN 我面临着判别器多次优于生成器的问题我正在尝试重现PA模型来自本文 http openaccess thecvf com content ICCV 2017 papers Sajjadi EnhanceNet Si
如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
如何使用pytorch构建多任务DNN，例如超过100个任务？

下面是使用 pytorch 为两个回归任务构建 DNN 的示例代码这forward函数返回两个输出 x1 x2 用于大量回归分类任务的网络怎么样例如 100 或 1000 个输出对所有输出例如 x1 x2 x100 进行硬编码绝对
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def

随机推荐

Hive架构及基础知识

1 用户接口 Client CLI hive shell JDBC ODBC java 访问 hive WEBUI 浏览器访问 hive 2 元数据 Metastore 元数据包括表名表所属的数据库默认是 default 表的拥有者
C++多态学习（二）完整定义：什么是多态？

多态分为静多态和动多态 1 静多态函数重载是一种多态现象通过命名倾轧在编译阶段决定故称为静多态 2 动多态动多态不是在编译器阶段决定而是在运行阶段决定故称为动多态动多态形成的条件如下 1 父类中有虚函数 2 子类overr
SpringBoot使用@Async实现多线程异步

SpringBoot使用 Async实现多线程异步一什么是异步说明在同步操作中我们执行到添加数据库的时候我们必须等待这个方法彻底执行完才能执行修改数据完成后发送短信完成后发送消息等操作如果插入数据库这个动作执行时间
全新防火墙6.0 单条PPPOE（ADSL）上网配置

一组网需求外网接口使用ADSL拨号内网为192 168 1 0 24网段实现基本上网功能二网络拓扑三配置要点 1 配置接口 wan1口接ADSL的接口务必勾选从服务器重新获得网关这样ADSL拨号成功后设备会自动生成默
软件工程面试——数据库

数据库实体的关系数据库中的实体关系指的是不同实体之间的相互依赖和联系实体关系是数据库设计中非常重要的一个概念它是用于描述不同实体之间的关系连接和交互方式的在数据库中一个实体通常指的是一个对象或者一个概念比如一个人一个订单或者
powerdesigner如何生成数据库表

1 建立逻辑数据模型 2 构建基础模板 3 转为PDM 4 生成sql文件数据库设计的步骤是什么
C++11新关键字noexcept、override、final把我们的心意告诉编译器

noexcept告诉编译器不抛异常异常时一定要处理的如果一个函数出现异常它内部不对该异常做处理异常会一直往上传递给函数的调用者到最后一直没有被处理程序就会终止调用std terminate 它默认调用std abort vo
以太坊交易信息及event、input、logs、topics等概念机制

文章目录一交易信息获取 1 1 合约事件例子定义 1 2 以太坊交易获取二 input解析 2 1 input内容解析 2 2 input处理逻辑三 logs解析 3 1 logs解析代码四 topics 4 1 概念 4 2 i
C++拷贝构造函数

目录前言一拷贝构造函数 1 概念 2 笔试题拷贝构造的次数 3 特征 1 拷贝构造函数是构造函数的一个重载形式 2 拷贝构造函数的参数只有一个且必须是类类型对象的引用使用传值方式编译器直接报错因为会引发无穷递归调用那怎么理解无
CS294-112 homework2 环境配置 environment configuration

先把结论最终结果放在最前面结论就是我没有在windows环境下配起来环境主要是因为不知道怎么解决C 14的问题最终是在ubuntu容器里配好了环境失败经历这一段是失败的经历写在这里是为了尽量让有相同经历的人能找到这篇博客
java8 List＜Map＜String, Object＞＞求和，排序，过滤，分组

List
2023年第十五届华中杯赛题C 题空气质量预测与预警

2023年五一假期期间数学建模竞赛就有四场各种比赛各种需求应接不暇因此对于本次浅析有不足的地方欢迎大家指出为了更好的帮助大家华中杯参赛下面带来 C题详细版思路由于C题的难度注定选题人数将不可计数因此对于每一问求解已经不再是
Unity 串口接收的报文不完整？处理方式在这

Unity 串口通讯接收完整报文并处理串口通讯 Read 函数的处理解决问题的过程对Read 函数的应用弊端结束串口通讯 Unity 中的串口通讯和C 的处理方式基本一致 Serial Read 可以读取缓存区中的十六进制数 S
Mybatis - 常用 SQL 语句设计思路及具体实现 - 数据存在则更新，不存在则插入、批量更新、批量插入、连表查询 + - 字段加减法

目录序言一数据存在则更新不存在则插入 ON DUPLICATE KEY UPDATE 的具体 xml 用法虽然有点问题但没准以后有用到的时候 on duplicate key update 用法总结二批量更新方法一方法
数组里的对象去重

今天分享的是数组对象去重的方式先看看数组对象的形式 let arrObj name 小红 id 1 name 小橙 id 1 name 小黄 id 4 name 小绿 id 3 name 小青 id 1 name 小蓝 id 4 下面是我
[人工智能-深度学习-26]：卷积神经网络CNN - 为啥要卷积神经网络以及卷积神经网络的应用

作者主页文火冰糖的硅基工坊文火冰糖王文兵的博客文火冰糖的硅基工坊 CSDN博客本文网址 https blog csdn net HiWangWenBing article details 120805258 目录第1章全连接
c语言动态内存管理

在C语言中有几个动态内存管理的函数分别是malloc calloc realloc和free free free函数用于释放由malloc calloc或realloc函数分配的内存空间它接受一个指向要释放的内存的指针作为参数注意
在kali linux里利用SQLmap实现SQL注入

SQLMap简介 SQLMap 是一个自动化的SQL注入工具其主要功能是扫描发现并利用给定URL的SQL注入漏洞内置了很多绕过插件支持的数据库是MySQL Oracle PostgreSQL Microsoft SQL Server
第五阶段学习测试

逐梦一单选题 1 下列各项中执行流程正确的是 A InputFormat Mapper Reducer OutputFormat B Mapper InputFormat Reducer OutputFormat C InputFor
《动手学深度学习 Pytorch版》 6.6 卷积神经网络

import torch from torch import nn from d2l import torch as d2l 6 6 1 LeNet LetNet 5 由两个部分组成卷积编码器由两个卷积核组成全连接层稠密块由三个全连

《动手学深度学习 Pytorch版》 6.6 卷积神经网络

6.6.1 LeNet

6.6.2 模型训练

练习

《动手学深度学习 Pytorch版》 6.6 卷积神经网络 的相关文章

随机推荐

热门标签

《动手学深度学习 Pytorch版》 6.6 卷积神经网络的相关文章