LeNET的学习以及代码实现

2023-11-01

根据李沐老师的动手深度学习的书进行学习

import torch
from torch import nn

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5), nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120), nn.Sigmoid(),
    nn.Linear(120, 84), nn.Sigmoid(),
    nn.Linear(84, 10))

输入的图像28×28 首先经过卷积层，使用6个5×5的卷积核进行卷积，会得到6个输出特征图，每个卷积核会生成一个特征图，特征图的大小通常用下面的公式所确定：

输出特征图大小 = （输入特征图大小 - 卷积核大小 + 2 × 填充大小）/ 步长 + 1

AvgPool2d池化操作通过计算每个窗口内的元素的平均值，将均值作为输出特征图对应位置的值

具体的作用有：

1 特征降维将输入的特征图的维度降低，从而减少计算量和参数数量。控制模型复杂度和减少过拟合有很大的帮助。

2 具有一定的平移不变性输入的特征图中相同特征的位置发生平移时，输出特征图中对应的位置不会改变。

经过池化层处理变成6个14×14的特征图，接下来继续卷积和池化。再通过全连接层得到输出。

X = torch.rand(size=(1, 1, 28, 28), dtype=torch.float32)
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape: \t',X.shape)

实现代码如下，用cpu训练模型

import time

import torch
import torch.nn as nn
from torch.nn import functional as F
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import torchvision.transforms as transforms

import torchvision
import matplotlib.pyplot as plt

class Animator:
    def __init__(self, xlabel='', xlim=None, legend=None):
        self.xlabel = xlabel
        self.xlim = xlim
        self.legend = legend
        self.fig, self.ax = plt.subplots()
        self.lines = []
        self.xdata, self.ydata = [], []
        self.init_plot()

    def init_plot(self):
        if self.xlim is not None:
            self.ax.set_xlim(*self.xlim)
        if self.legend is not None:
            self.ax.legend(self.legend)

    def add(self, x, y):
        self.xdata.append(x)
        self.ydata.append(y)
        self.update_plot()

    def update_plot(self):
        self.ax.clear()
        for line, label, y in zip(self.lines, self.legend, self.ydata):
            line.set_data(self.xdata, y)
            self.ax.plot(self.xdata, y, label=label)
        self.ax.set_xlabel(self.xlabel)
        self.ax.legend(self.legend)
        self.fig.canvas.draw()

    def show(self):
        plt.show()

net = nn.Sequential(
    nn.Conv2d(1, 6, kernel_size=5, padding=2),nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Conv2d(6, 16, kernel_size=5),nn.Sigmoid(),
    nn.AvgPool2d(kernel_size=2, stride=2),
    nn.Flatten(),
    nn.Linear(16 * 5 * 5, 120),nn.Sigmoid(),
    nn.Linear(120, 84),nn.Sigmoid(),
    nn.Linear(84, 10)
)

X = torch.rand(size=(1, 1, 28, 28),dtype=torch.float32)
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__, 'output shape: \t', X.shape)

batch_size = 256

# Define the data transforms for resizing and normalization
transform = transforms.Compose([
    transforms.Resize((28, 28)),
    transforms.ToTensor(),          # Convert images to tensors
    transforms.Normalize((0.5,), (0.5,))
])

# Load the Fashion MNIST dataset
mnist_train = torchvision.datasets.FashionMNIST(
    root='C:/Users/10854/pythonProject4', train=True, transform=transform, download=True
)
mnist_test = torchvision.datasets.FashionMNIST(
    root='C:/Users/10854/pythonProject4', train=False, transform=transform, download=True
)

# Create data loaders for training and testing
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True)
test_iter = torch.utils.data.DataLoader(mnist_test, batch_size=batch_size, shuffle=False)
loss_fn = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01)
lr_scheduler = optim.lr_scheduler.StepLR(optimizer, step_size=5, gamma=0.1)
device = torch.device("cpu")
# Training loop
lr, num_epochs = 0.9, 10
def evaluate_accuracy(net, data_iter, device=None):
    if isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device

    # 正确预测的数量，总预测的数量
    correct_predictions = 0
    total_predictions = 0

    with torch.no_grad():
        for X, y in data_iter:
            X = X.to(device)
            y = y.to(device)
            y_hat = net(X)
            _, predicted = torch.max(y_hat, 1)
            correct_predictions += (predicted == y).sum().item()
            total_predictions += y.numel()

    accuracy = correct_predictions / total_predictions
    return accuracy

def train_ch6(net, train_iter, test_iter, num_epochs, lr, device):
    """用CPU训练模型"""
    def init_weights(m):
        if isinstance(m, nn.Linear) or isinstance(m, nn.Conv2d):
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    print('training on', device)
    net.to(device)
    optimizer = torch.optim.SGD(net.parameters(), lr=lr)
    loss = nn.CrossEntropyLoss()
    animator = Animator(xlabel='epoch', xlim=[1, num_epochs],
                        legend=['train loss', 'train acc', 'test acc'])
    timer, num_batches = time.time(), len(train_iter)
    for epoch in range(num_epochs):
        # 训练损失之和，训练准确率之和，样本数
        metric = [0.0, 0.0, 0]
        net.train()
        for i, (X, y) in enumerate(train_iter):
            optimizer.zero_grad()
            X, y = X.to(device), y.to(device)
            y_hat = net(X)
            l = loss(y_hat, y)
            l.backward()
            optimizer.step()
            with torch.no_grad():
                metric[0] += l.item() * X.shape[0]
                correct = torch.eq(torch.argmax(y_hat, dim=1), y).float()
                metric[1] += torch.sum(correct).item()
                metric[2] += X.shape[0]
            train_l = metric[0] / metric[2]
            train_acc = metric[1] / metric[2]
            if (i + 1) % (num_batches // 5) == 0 or i == num_batches - 1:
                animator.add(epoch + (i + 1) / num_batches,
                             (train_l, train_acc, None))
        test_acc = evaluate_accuracy(net, test_iter, device)
        animator.add(epoch + 1, (None, None, test_acc))
    print(f'loss {train_l:.3f}, train acc {train_acc:.3f}, '
          f'test acc {test_acc:.3f}')
    print(f'{metric[2] * num_epochs / (time.time() - timer):.1f} examples/sec '
          f'on {str(device)}')


train_ch6(net, train_iter, test_iter, num_epochs, lr, device)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

学习

python

深度学习

LeNET的学习以及代码实现的相关文章

我如何在 python 2.6 中测试抽象方法

我有一个抽象类 import abc class Hello object metaclass abc ABCMeta abc abstractmethod def add self foo pass abc abstractmethod
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
如何使用 HTTP 标头发送非英语 unicode 字符串？

我是 HTTP 相关问题的新手我的问题是在 iOS 开发中我想使用 HTTP 标头发送一个字符串所以我使用 httpRequest setValue nonEnglishString forHTTPHeaderField custom
小数缓存是Python规范中定义的还是一个实现细节？

Python 似乎有一个所谓的小数字缓存用于存储 5 到 256 范围内的数字我们可以使用以下程序来演示这一点 for i in range 7 258 if id i id i 0 print i is cached else pr
OpenCV - 我需要将彩色图像插入黑白图像并且

我用以下代码将黑白图像插入彩色图像没问题 face grey cv cvtColor face cv COLOR RGB2GRAY for row in range 0 face grey shape 0 for column in ra
Seaborn 热图中的自定义调色板间隔

我正在尝试绘制一个heatmap https seaborn pydata org generated seaborn heatmap html使用seaborn库绘图函数如下所示 def plot confusion matrix da
从主机名中提取域名

是否有一种编程方式可以从给定的主机名查找域名给出 gt www yahoo co jp 返回 gt yahoo co jp 有效但非常慢的方法是拆分为并从左侧删除 1 个组使用 dnspython 加入并查询 SOA 记录当返回有
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
PyCharm 无法识别字典值类型

我有一个简单的代码片段其中我将字典值设置为空列表 new dict for i in range 1 13 new dict i 现在如果在下一行的循环内我会输入new dict i 并添加一个点我希望 PyCharm 向我显示可用于
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
使 np.loadtxt 使用多个可能的分隔符

我有一个程序可以读取数据文件用户可以选择他们想要使用的列我希望它对于输入文件更加通用有时列可能如下所示 10 34 24 58 8 284 6 121 有时它们可能看起来像这样 10 34 24 58 8 284 6 121 我希
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
Python 队列 get()/task_done() 问题

我的消费者端队列 m queue get queue task done
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败
在至少 7 天内连续三天登录该产品的用户

我有一个用于用户参与的数据框 df 如下所示 time stamp user id 2013 01 01 10 05 23 1 2013 01 03 16 35 23 1 2013 01 06 11 06 35 1 2013 01 10 1
在Python中从CSV文件中获取随机行并找到相应的单词，就像测验一样

抱歉标题含糊不清想不出更好的表达方式我有一个包含德语英语单词的 CSV 文件如下所示 Ja Yes Nein No Katze Cat 我希望我的 python 脚本从 CSV 文件中打印一个随机的德语单词并要求他们输入英语单词

随机推荐

用C++做高级病毒

今天教大家做几个超级厉害的病毒看完这篇文章之后你就能成为一名高级黑客了声明若电脑收到损伤作者一律不负责 1 鼠标病毒作用让鼠标一直停在一个地方动不了 include
js Dom事件

1 onclick 点击事件 2 ondbclick 双击事件 3 onmousedown 鼠标按下事件 4 onmouseup 鼠标松开事件 5 onmouseenter 鼠标移入事件不支持冒泡只触发一次 6 onmouseover
xml实体小实例

如何定义和使用实体一下是实体的一个小实例 gt
C++里仿函数是什么

一什么是仿函数仿函数的意思是它不是函数其实是个类但用法和函数一样既然是个类就可以存储很多变量和其他的信息然后实现纯函数实现不了的功能所以在一些需要函数作为参数的地方可以用仿函数代替在STL里很多地方用到了仿函数二仿函
Java 密码复杂度校验

1 需求复杂性用户的密码中必须包含的字符类型默认为中弱必须包含小写字母中必须包含小写字母数字强必须包含小写字母数字大写字母特殊字符鼠标移入的提示文字相同注检查密码复杂度仅新增账户重置密码时生效已有账户密
揭示OLED透明屏数据：探索未来显示技术的潜力

OLED透明屏作为一项颇具吸引力的显示技术以其独特的特点和卓越的画质在市场上引起了广泛关注在这篇文章中尼伽将和大家一起深入探索OLED透明屏的数据通过具体的市场趋势分析技术指标解析应用领域探讨和未来前景展望为读者提供全面了解和
wish虚拟服务器,云服务器操作wish

云服务器操作wish 内容精选换一换按需计费按需计费是后付费模式按弹性云服务器的实际使用时长计费可以随时开通删除弹性云服务器包年包月包年包月是预付费模式按订单的购买周期计费适用于可预估资源使用周期的场景价格比按需计
[开发

ModelMapper是一个用于对象之间转换的Java库它能够自动映射一个Java对象的属性到另一个Java对象依赖安装
C/C++

文章目录空间的读写作用实现strlen 实现strcpy 非字符空间 void 返回值返回连续空间类型示例函数内部实现示例参考麦子学院嵌入式C语言高级 C语言函数的使用空间的读写 void fun char p con
VUE enement-ui之table表格隐藏滚动条

只需修改样式即可 deep el table body wrapper webkit scrollbar width 0 注意 element ui表格很多样式修改都需要加深度穿透才能生效效果图
深度神经网络的matlab实现,深度神经网络代码matlab

为什么不用matlab做深度学习 matlab可以做深度学习但是从实用性的角度来讲matlab的实现效率相对较低训练耗时较长初次学习计算机语言就选择matlab不是一个明智的选择最好选用C或者Basic作为入门语言 matlab是一
初探C语言链表（一）

初探链表一静态链表二动态链表初始化链表 1 尾插法建立链表 2 头插法建立链表三动态链表的基本操作 1 遍历 2 查找 3 插入 4 清空 5 删除 6 销毁四链表的综合应用什么是链表链表是由一系列节点组成每个节点包
面试经验：阿里Java后台开发

最近原来实习时候的Boss联系我说他跳槽到了阿里问我有没有兴趣面一个Java后台开发岗位考虑到我只工作了一年现在去阿里肯定要降薪因此也没有太强烈的意愿但出于提升自我的角度考虑参加了面试一面电话面试一小时首先做一个简单的自
09虚幻4【UE4】中模型沿着轨道运动

目录一创建Track蓝图类轨道并添加一个Spline样条曲线二创建TrackCar 移动车蓝图类并添加一个Mesh 车方块都可以三编写TrackCar的蓝图逻辑 3 1 设置自定义事件MoveCar 3 2 添加时间轴
Python全栈开发【基础-04】一文彻底理解Python变量

专栏介绍本专栏为Python全栈开发系列文章技术包括Python基础函数文件面向对象网络编程并发编程 MySQL数据库 HTML JavaScript CSS JQuery bootstrap WSGI Django Flas
Android手写占位式插件化框架之apk解析原理系统源码分析

前些天发现了一个蛮有意思的人工智能学习网站 8个字形容一下通俗易懂风趣幽默感觉非常有意思忍不住分享一下给大家点击跳转到教程前言上一篇文章 Android手写占位式插件化框架之Activity通信 Service通信和Broad
JAVA--不同包类的相互访问

1 不同包之间的访问在定义类之前使用import 加导入的类名 2 不同包没有任何关系的两个类只有public的类中的public成员才能被另一个包访问 package yi 第一个包 public class A public void
sqlserver数据库触发器,对当前的表数据插入时，根据条件防止数据重复插入。

这是一个之前做项目用的以下是触发器sql语句直接执行即可如果需求不一样需要修改对应的语句就行 USE NetCoreWebApi GO Object Trigger dbo testInsertTrigger Script Date
git clone 遇到问题：fatal: unable to access

git clone 遇到问题 fatal unable to access https github com ros planning navigation git Failed to connect to 127 0 0 1 port 4
LeNET的学习以及代码实现

根据李沐老师的动手深度学习的书进行学习 import torch from torch import nn net nn Sequential nn Conv2d 1 6 kernel size 5 padding 2 nn Sigmoid

LeNET的学习以及代码实现

LeNET的学习以及代码实现 的相关文章

随机推荐

热门标签

LeNET的学习以及代码实现的相关文章