利用pytorch 实现深度残差网络(deep_residual_neural_network)

2023-10-27

利用pytorch 实现深度残差网络

深度残差网络
代码实现
输出结果

深度残差网络

残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络，在2015年的ImageNet大规模视觉识别竞赛（ImageNet Large Scale Visual Recognition Challenge, ILSVRC）中获得了图像分类和物体识别的优胜。残差网络的特点是容易优化，并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃连接，缓解了在深度神经网络中增加深度带来的梯度消失问题。
在这里插入图片描述
更加具体的关于此网络结构的内容见原文：提取码：auiq.

代码实现


import torch
import torch.nn as nn
import torchvision
import torchvision.transforms as transforms

# Device configuration
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Hyper-parameters
num_epochs = 80
batch_size = 100
learning_rate = 0.001

# Image preprocessing modules
transform = transforms.Compose([
    transforms.Pad(4),
    transforms.RandomHorizontalFlip(),
    transforms.RandomCrop(32),
    transforms.ToTensor()])

# CIFAR-10 dataset
train_dataset = torchvision.datasets.CIFAR10(root='G:/pytorch666/data',
                                             train=True,
                                             transform=transform,
                                             download=True)

test_dataset = torchvision.datasets.CIFAR10(root='G:/pytorch666/data',
                                            train=False,
                                            transform=transforms.ToTensor())

# Data loader
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                           batch_size=batch_size,
                                           shuffle=True)

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                          batch_size=batch_size,
                                          shuffle=False)


# 3x3 convolution
def conv3x3(in_channels, out_channels, stride=1):
    return nn.Conv2d(in_channels, out_channels, kernel_size=3,
                     stride=stride, padding=1, bias=False)


# Residual block
class ResidualBlock(nn.Module):
    def __init__(self, in_channels, out_channels, stride=1, downsample=None):
        super(ResidualBlock, self).__init__()
        self.conv1 = conv3x3(in_channels, out_channels, stride)
        self.bn1 = nn.BatchNorm2d(out_channels)
        self.relu = nn.ReLU(inplace=True)
        self.conv2 = conv3x3(out_channels, out_channels)
        self.bn2 = nn.BatchNorm2d(out_channels)
        self.downsample = downsample

    def forward(self, x):
        residual = x
        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu(out)
        out = self.conv2(out)
        out = self.bn2(out)
        if self.downsample:
            residual = self.downsample(x)
        out += residual
        out = self.relu(out)
        return out


# ResNet
class ResNet(nn.Module):
    def __init__(self, block, layers, num_classes=10):
        super(ResNet, self).__init__()
        self.in_channels = 16
        self.conv = conv3x3(3, 16)
        self.bn = nn.BatchNorm2d(16)
        self.relu = nn.ReLU(inplace=True)
        self.layer1 = self.make_layer(block, 16, layers[0])
        self.layer2 = self.make_layer(block, 32, layers[1], 2)
        self.layer3 = self.make_layer(block, 64, layers[2], 2)
        self.avg_pool = nn.AvgPool2d(8)
        self.fc = nn.Linear(64, num_classes)

    def make_layer(self, block, out_channels, blocks, stride=1):
        downsample = None
        if (stride != 1) or (self.in_channels != out_channels):
            downsample = nn.Sequential(
                conv3x3(self.in_channels, out_channels, stride=stride),
                nn.BatchNorm2d(out_channels))
        layers = []
        layers.append(block(self.in_channels, out_channels, stride, downsample))
        self.in_channels = out_channels
        for i in range(1, blocks):
            layers.append(block(out_channels, out_channels))
        return nn.Sequential(*layers)

    def forward(self, x):
        out = self.conv(x)
        out = self.bn(out)
        out = self.relu(out)
        out = self.layer1(out)
        out = self.layer2(out)
        out = self.layer3(out)
        out = self.avg_pool(out)
        out = out.view(out.size(0), -1)
        out = self.fc(out)
        return out


model = ResNet(ResidualBlock, [2, 2, 2]).to(device)

# Loss and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)


# For updating learning rate
def update_lr(optimizer, lr):
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr


# Train the model
total_step = len(train_loader)
curr_lr = learning_rate
for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        images = images.to(device)
        labels = labels.to(device)

        # Forward pass
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Backward and optimize
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if (i + 1) % 100 == 0:
            print("Epoch [{}/{}], Step [{}/{}] Loss: {:.4f}"
                  .format(epoch + 1, num_epochs, i + 1, total_step, loss.item()))

    # Decay learning rate
    if (epoch + 1) % 20 == 0:
        curr_lr /= 3
        update_lr(optimizer, curr_lr)

# Test the model
model.eval()
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_loader:
        images = images.to(device)
        labels = labels.to(device)
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

    print('Accuracy of the model on the test images: {} %'.format(100 * correct / total))

# Save the model checkpoint
torch.save(model.state_dict(), 'resnet.ckpt')

输出结果

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

利用pytorch 实现深度残差网络(deep_residual_neural_network) 的相关文章

如何在pytorch中查看DataLoader中的数据

我在 Github 上的示例中看到类似以下内容如何查看该数据的类型形状和其他属性 train data MyDataset int 1e3 length 50 train iterator DataLoader train data b
LSTM 错误：AttributeError：“tuple”对象没有属性“dim”

我有以下代码 import torch import torch nn as nn model nn Sequential nn LSTM 300 300 nn Linear 300 100 nn ReLU nn Linear 300 7
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
如何更新 PyTorch 中神经网络的参数？

假设我想将神经网络的所有参数相乘PyTorch 继承自的类的实例torch nn Module http pytorch org docs master nn html torch nn Module by 0 9 我该怎么做呢 Let n
如何计算 CNN 第一个线性层的维度

目前我正在使用 CNN 其中附加了一个完全连接的层并且我正在使用尺寸为 32x32 的 3 通道图像我想知道是否有一个一致的公式可以用来计算第一个线性层的输入尺寸和最后一个卷积最大池层的输入我希望能够计算第一个线性层的尺寸仅给出
将 Keras (Tensorflow) 卷积神经网络转换为 PyTorch 卷积网络？

Keras 和 PyTorch 使用不同的参数进行填充 Keras 需要输入字符串而 PyTorch 使用数字有什么区别如何将一个转换为另一个哪些代码在任一框架中获得相同的结果 PyTorch 还采用参数 in channels o
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
如何有效地对一个数组中某个值在另一个数组中的位置出现的次数求和

我正在寻找一种有效的 for 循环避免解决方案来解决我遇到的数组相关问题我想使用一个巨大的一维数组 A gt size 250 000 用于一维索引的 0 到 40 之间的值以及用于第二维索引的具有 0 到 9995 之间的值的相同大
Pytorch CUDA 错误：没有内核映像可用于在带有 cuda 11.1 的 RTX 3090 设备上执行

如果我运行以下命令 import torch import sys print A sys version print B torch version print C torch cuda is available print D torc
Pytorch 损失为 nan

我正在尝试用 pytorch 编写我的第一个神经网络不幸的是当我想要得到损失时遇到了问题出现以下错误信息 RuntimeError Function LogSoftmaxBackward0 returned nan values in
pytorch 的 IDE 自动完成

我正在使用 Visual Studio 代码最近尝试了风筝这两者似乎都没有 pytorch 的自动完成功能这些工具可以吗如果没有有人可以推荐一个可以的编辑器吗谢谢你使用Pycharmhttps www jetbrains co
PyTorch 中的连接张量

我有一个张量叫做data形状的 128 4 150 150 其中 128 是批量大小 4 是通道数最后 2 个维度是高度和宽度我有另一个张量叫做fake形状的 128 1 150 150 我想放弃最后一个list array从第 2 维
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
如何计算cifar10数据的平均值和标准差

Pytorch 使用以下值作为 cifar10 数据的平均值和标准差变换 Normalize 0 5 0 5 0 5 0 5 0 5 0 5 我需要理解计算背后的概念因为这些数据是 3 通道图像我不明白什么是相加的什么是除什么的等等
Pytorch RuntimeError：“host_softmax”未针对“torch.cuda.LongTensor”实现

我正在使用 pytorch 来训练模型但是在计算交叉熵损失时我遇到了运行时错误 Traceback most recent call last File deparser py line 402 in
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
PyTorch：运行时错误：函数 MulBackward0 在索引 0 处返回无效梯度 - 预期类型 torch.cuda.FloatTensor 但得到 torch.FloatTensor

我不明白这个错误告诉我什么在另一个帖子 https github com NVIDIA flownet2 pytorch issues 139也解决了同样的问题但没有有效的解决方案 Traceback most recent call
如何使用 PyTorch 沿特定维度进行热编码？

我有一个大小的张量 3 15 136 where 3 is batch size 15 sequence length and 136 is tokens 我想使用中的概率来单热我的张量tokens维度 136 为此我想提取序列长度中每个
pytorch dataloader - 运行时错误：堆栈期望每个张量大小相等，但在条目 0 处得到 [157]，在条目 1 处得到 [154]

我是 pytorch 的初学者我正在尝试进行基于方面的情感分析我面临着主题中提到的错误我的代码如下我请求帮助解决此错误提前致谢我将分享整个代码和错误堆栈 pip install transformers import trans

随机推荐

QT引入及基本介绍

文章目录嵌入式项目的图形解决方案 QT 跨平台的实现 qmake vs cmake base class QWidget QMainWindow QDialog kits Hello World 创建项目 hello pro项目文件 ui
img标签及属性

一 img标签 1 img标签的作用用来告诉浏览器我们需要显示一张图片 2 img标签格式 img src img标签中的src是英文source的缩写 src 是用来告诉img标签需要显示的图片名称 3 注意点和H系列标签 P标签
C语言每日一练——第133天：打鱼还是晒网

前言 Wassup guys 我是Edison 今天是C语言每日一练第133天 Let s get it 文章目录 1 问题描述 2 题目分析 3 算法设计 4 流程框架求出指定日期距离 5 代码实现 1 问题描述中国有句俗语叫三天
java中统计一个字符串中出现最多的字符和次数

用Map来存储被拆分成数组的字符串 key为字符 value为出现次数 package net hncu other import java io UnsupportedEncodingException import java util
Unity快速适配IOS/安卓刘海屏（又简单又快适配了O版本和P版本）

刘海屏适配其实就是知道刘海高度横屏游戏来对ui进行偏移所以刘海屏适配的关键是获取刘海高度获取刘海高度有三种方案 1 大数据收集各种型号对应的刘海数据听说腾讯有些项目这么搞 2 代码获取热门机型获取刘海数据小众机型不是and
XGBoost详解

文章目录背景目标函数最优切分点算法 Shrinkage 收缩过程缺失值处理优缺点总结背景在看Xgboost之前先看看笔者写的AdaBoost 和GBDT AdaBoost 关注的是哪些错误分类的样本每次加大误分类样本的权
越丰满的稻穗，头垂得越低

author skate time 2010 06 18 职场中有三种人主动空杯者被动空杯者和拒绝空杯者毫无疑问拒绝空杯者要么停滞不前要么倒退要么成为他人的绊脚石一般情况下人们会把自己没有获得职业升迁的责任
java自动化测试语言基础之Stream、File和IO

java自动化测试语言基础之Stream File和IO 文章目录 java自动化测试语言基础之Stream File和IO Java 流 Stream 文件 File 和IO Java 流 Stream 文件 File 和IO Java
Flutter FutureBuilder 返回空 Flutter_BUG_A build function returned null

一定是没有返回widget 检查下return了没有
vs2019+QT新建UI窗口

在vs2019中新建一个QT的widget窗口第一步第二步其中可以选择MainWindow或者Widget窗口填写好ui的名字第三步建立好对应ui名字的 h 和 cpp文件即可双击新建的ui文件如果打不开的话可以重新配置一
解决nes_py在pip安装报错的问题

目录项目场景问题描述原因分析解决方案解决结果项目场景想跟随油管某视频复现强化学习方法玩超级马里奥的过程结果在在Anaconda3虚拟环境中用pip安装nes py时一直报错报错信息如下 Building wheel for
浏览器与Node的事件循环(Event Loop)有何区别?

前言本文我们将会介绍 JS 实现异步的原理并且了解了在浏览器和 Node 中 Event Loop 其实是不相同的一线程与进程 1 概念我们经常说JS 是单线程执行的指的是一个进程里只有一个主线程那到底什么是线程什么是进程
PAT乙级1043 输出PATest (20 分)

1043 输出PATest 20 分一问题描述给定一个长度不超过 10 4 的仅由英文字母构成的字符串请将字符重新调整顺序按 PATestPATest 这样的顺序输出并忽略其它字符当然六种字符的个数不一定是一样多的若某种
初识微服务技术栈

目录什么是微服务注册中心配置中心服务网关分布式缓存和数据库分布式搜素消息队列分布式日志服务系统的监控链路追踪持续集成 1 认识微服务 1 0 学习目标 1 1 单体架构 1 2 分布式架构 1 3 微服务 1 4 微服务
由于找不到packet.dll,无法继续执行代码的多种解决方法分享

在计算机领域中 packet dll是一个重要的动态链接库文件它被用来进行网络数据包的捕获和分析然而有时我们可能会遇到packet dll缺失的问题这将导致我们无法正常执行代码下面我们将为你详细介绍如何解决这个问题以确保你的代码
JS的执行上下文，变量声明提升，函数声明提升

目录一什么是执行上下文 execution content 二执行上下文的类型三执行上下文的生命周期以函数执行上下文为例四变量声明提升五函数声明提升一什么是执行上下文 execution content 一句话执行
java子类构造器第一行没有写super()为什么还会调用父类？

子类构造器第一行会默认隐藏了super 隐式语句如果第一行是this 的话隐式super 会消失备注第一行只能允许this或者super 不可同时都写入
Nginx配置WebSocket（WS）和WebSocket Secure（WSS）的完整指南

点点关注点点关注点点关注 Nginx是一款广泛使用的高性能Web服务器和反向代理服务器除了传统的HTTP和HTTPS协议支持外 Nginx还可以配置WebSocket WS 和WebSocket Secure WSS 以便实现实时双向
android override报错,android @override 报错解决方案

android override 报错解决方案现象 java 1801 method does not override a method from its superclass Override 原因 Eclipse is defaul
利用pytorch 实现深度残差网络(deep_residual_neural_network)

利用pytorch 实现深度残差网络深度残差网络代码实现输出结果深度残差网络残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络在2015年的ImageNet大规模视觉识别竞赛 ImageNet La