ResNet实战：CIFAR-10数据集分类

2023-12-21

本节将使用ResNet实现CIFAR-10数据集分类。

CIFAR-10数据集共有60000幅彩色图像，这些图像是32×32像素的，分为10个类，每类6000幅图。这里面有50000幅用于训练，构成了5个训练批，每一批10000幅图；另外10000幅图用于测试，单独构成一批。测试批的数据取自100类中的每一类，每一类随机取1000幅图。抽剩下的就随机排列组成训练批。注意，一个训练批中的各类图像的数量并不一定相同，总的来看，训练批每一类都有5000幅图，如图7-9所示。

图7-9 CIFAR-10数据集

读者自行搜索CIFAR-10数据集下载地址，进入下载页面后，选择下载方式，如图7-10所示。

图7-10 下载方式

由于PyTorch 2.0采用Python语言编程，因此选择python version版本下载。下载之后解压缩，得到如图7-11所示的几个文件。

图7-11 得到的文件

data_batch_1 ~ data_batch_5 是划分好的训练数据，每个文件中包含10000幅图片，test_batch是测试集数据，也包含10000幅图片。

读取数据的代码如下：

import pickle

def load_file(filename):

with open(filename, 'rb') as fo:

data = pickle.load(fo, encoding='latin1')

return data

首先定义读取数据的函数，这几个文件都是通过pickle产生的，所以在读取的时候也要用到这个包。返回的data是一个字典，先来看这个字典里面有哪些键。

data = load_file('data_batch_1')

print(data.keys())

输出结果如下：

dict_keys([ 'batch_label', 'labels', 'data', 'filenames' ])

具体说明如下：

batch_label：对应的值是一个字符串，用来表明当前文件的一些基本信息。
labels：对应的值是一个长度为10000的列表，每个数字取值范围为0~9，代表当前图片所属的类别。
data：10000×3072的二维数组，每一行代表一幅图片的像素值。
filenames：长度为10000的列表，里面每一项是代表图片文件名的字符串。

完整的数据读取函数如下。

import pickle
import numpy as np
import os
def get_cifar10_train_data_and_label(root=""):
    def load_file(filename):
        with open(filename, 'rb') as fo:
            data = pickle.load(fo, encoding='latin1')
        return data

    data_batch_1 = load_file(os.path.join(root, 'data_batch_1'))
    data_batch_2 = load_file(os.path.join(root, 'data_batch_2'))
    data_batch_3 = load_file(os.path.join(root, 'data_batch_3'))
    data_batch_4 = load_file(os.path.join(root, 'data_batch_4'))
    data_batch_5 = load_file(os.path.join(root, 'data_batch_5'))
    dataset = []
    labelset = []
    for data in [data_batch_1, data_batch_2, data_batch_3, data_batch_4, data_batch_5]:
        img_data = (data["data"])
        img_label = (data["labels"])
        dataset.append(img_data)
        labelset.append(img_label)
    dataset = np.concatenate(dataset)
    labelset = np.concatenate(labelset)
    return dataset, labelset

def get_cifar10_test_data_and_label(root=""):
    def load_file(filename):
        with open(filename, 'rb') as fo:
            data = pickle.load(fo, encoding='latin1')
        return data
    data_batch_1 = load_file(os.path.join(root, 'test_batch'))
    dataset = []
    labelset = []
    for data in [data_batch_1]:
        img_data = (data["data"])
        img_label = (data["labels"])
        dataset.append(img_data)
        labelset.append(img_label)
    dataset = np.concatenate(dataset)
    labelset = np.concatenate(labelset)
    return dataset, labelset

def get_CIFAR10_dataset(root=""):
    train_dataset, label_dataset = get_cifar10_train_data_and_label(root=root)
    test_dataset, test_label_dataset = get_cifar10_train_data_and_label(root=root)
    return train_dataset, label_dataset, test_dataset, test_label_dataset

if __name__ == "__main__":
    train_dataset, label_dataset, test_dataset, test_label_dataset = get_CIFAR10_dataset(root="../dataset/cifar-10-batches-py/")

train_dataset = np.reshape(train_dataset,[len(train_dataset),3,32,32]). astype(np.float32)/255.
test_dataset = np.reshape(test_dataset,[len(test_dataset),3,32,32]). astype(np.float32)/255.
label_dataset = np.array(label_dataset)
test_label_dataset = np.array(test_label_dataset)

其中的root参数是下载数据解压后的目录，os.join函数将其组合成数据文件的位置。最终返回训练文件、测试文件以及它们对应的label。由于我们提取出的文件数据格式为[-1,3072]，因此需要重新对数据维度进行调整，使之适用模型的输入。

7.2.2 基于ResNet的CIFAR-10数据集分类

前面章节中，我们对ResNet模型以及CIFAR-10数据集做了介绍，本小节将使用前面定义的ResNet模型进行分类任务。

在7.2.1节中已经介绍了CIFAR-10数据集的基本构成，并讲解了ResNet的基本模型结构，接下来直接导入对应的数据和模型即可。完整的模型训练如下：

import torch
import resnet
import get_data
import numpy as np

train_dataset, label_dataset, test_dataset, test_label_dataset = get_data.get_CIFAR10_dataset(root="../dataset/cifar-10-batches-py/")

train_dataset = np.reshape(train_dataset,[len(train_dataset),3,32,32]). astype(np.float32)/255.
test_dataset = np.reshape(test_dataset,[len(test_dataset),3,32,32]). astype(np.float32)/255.
label_dataset = np.array(label_dataset)
test_label_dataset = np.array(test_label_dataset)

device = "cuda" if torch.cuda.is_available() else "cpu"
model = resnet.resnet18()                  	#导入ResNet模型
model = model.to(device)                		#将计算模型传入GPU硬件等待计算
model = torch.compile(model)            		#PyTorch 2.0的特性，加速计算速度
optimizer = torch.optim.Adam(model.parameters(), lr=2e-5)   #设定优化函数
loss_fn = torch.nn.CrossEntropyLoss()

batch_size = 128
train_num = len(label_dataset)//batch_size
for epoch in range(63):

    train_loss = 0.
    for i in range(train_num):
        start = i * batch_size
        end = (i + 1) * batch_size

        x_batch = torch.from_numpy(train_dataset[start:end]).to(device)
        y_batch = torch.from_numpy(label_dataset[start:end]).to(device)

        pred = model(x_batch)
        loss = loss_fn(pred, y_batch.long())

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        train_loss += loss.item()  # 记录每个批次的损失值

    # 计算并打印损失值
    train_loss /= train_num
    accuracy = (pred.argmax(1) == y_batch).type(torch.float32).sum().item() / batch_size
    
    #2048可根据读者GPU显存大小调整
    test_num = 2048
    x_test = torch.from_numpy(test_dataset[:test_num]).to(device)
    y_test = torch.from_numpy(test_label_dataset[:test_num]).to(device)
    pred = model(x_test)
    test_accuracy = (pred.argmax(1) == y_test).type(torch.float32).sum().item() / test_num
    print("epoch：",epoch,"train_loss:", round(train_loss,2),";accuracy:",round(accuracy,2),";test_accuracy:",round(test_accuracy,2))

在这里使用训练集数据对模型进行训练，之后使用测试集数据对其输出进行测试，训练结果如图7-12所示。

图7-12 训练结果

可以看到，经过5轮后，模型在训练集的准确率达到0.99，在测试集的准确率也达到0.98，这是一个较好的成绩，可以看到模型的性能达到较高水平。

其他层次的模型请读者自行尝试，根据读者自己不同的硬件设备，模型的参数和训练集的batch_size都需要作出调整，具体数值请根据需要对它们进行设置。

本文节选自《从零开始大模型开发与微调：基于PyTorch与ChatGLM》，获出版社和作者授权共享。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

数据挖掘

人工智能

ResNet实战：CIFAR-10数据集分类的相关文章

Jenkins流水线怎么做？

问CHAT Jenkins流水线怎么做 CHAT回复 Jenkins流水线是一种创建测试和部署应用程序的方法以下是为Jenkins创建流水线的步骤 1 安装Jenkins 首先你需要在你的服务器上安装Jenkins 这个过程可能会根据你
扬帆证券：产业化破题在即人形机器人超预期演进

大模型助力下的拐点特斯拉A股产业链上两笔重磅出资几乎一起现身总规划超百亿元 1月4日拓普集团公告与宁波经济技能开发区办理委员会签署了机器人电驱系统研发生产基地项目出资协议书公司拟出资50亿元建设机器人核心部件生产基地此次出
2024年华数杯国际赛B题：光伏发电功率思路模型代码解析

2024年华数杯国际赛B题光伏发电功率 Photovoltaic Power 一问题描述中国的电力构成包括传统能源发电如煤油和天然气可再生能源发电如水电风能太阳能和核能以及其他形式的电力这些发电模式在满足中国对电力的巨
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【图像融合】基于联合双边滤波和局部梯度能量的多模态医学图像融合研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码图像文章
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
喜报|华测导航荣获“张江之星”领军型企业称号

近日 2023年度张江之星企业培育名单发布上海华测导航荣获2023年度张江之星领军型企业称号据悉张江之星企业培育是上海科创办为落实关于推进张江高新区改革创新发展建设世界领先科技园区的若干意见张江高新区加快世界领先科技园区
用CHAT分析高校体育智慧教学体系构建与探索研究现状

CHAT回复现阶段高校体育智慧教学体系的构建与探索研究还处于初级阶段但全球数字化转型大潮的推动下一些较为前沿的研究和实践已经开始出现 1 教学平台的建设很多高校已经开始尝试使用在线教育平台进行体育教学把传统的面对面授课模式转变为
多模态、长文本、智能体，智谱AI推出GLM-4模型全家桶，发布即上线！

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入 2024年01月16日智谱AI首届技术开放日 Zhipu DevDay 在北京中关村国家自主创新示范区展示中心成功举办现场智谱AI团队全面展示了其投身于大模型事业三年多来所
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
人工智能 AI 如何让我们的生活更加便利

每个人都可以从新技术中获益一想到工作或生活更为便利简捷且拥有更多空余时间谁会不为之高兴呢借助人工智能每天能够多一些空余时间或丰富自己的业余生活为培养日常兴趣爱好增添一点便利从电子阅读器到智能家居再到植物识别应用和智能室内花
主流进销存系统有哪些？企业该如何选择进销存系统？

主流进销存系统有哪些企业该如何选择进销存系统永久免费的软件这个可能还真不太可能有而且就算有也只能说是相对免费因为要么就是数据存量有限要么就是功能有限数据信息都不保障并且功能不完全免费免费软件免费进销存诸如此类
CorelDRAW2024官方中文版重磅发布更新

35年专注于矢量设计始于1988年并不断推陈出新致力为全球设计工作者提供更高效的设计工具 CorelDRAW 滋养并见证了一代设计师的成长在最短的时间内交付作品 CorelDRAW的智能高效会让你一见钟情 CorelDRAW 全称 Co
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金

随机推荐

计算机提示vcruntime140.dll丢失的解决方法,多种修复教程分享

vcruntime140 dll是一个非常重要的动态链接库文件它包含了许多运行时的函数和类然而有时候我们可能会遇到vcruntime140 dll无法继续执行代码的问题这会给我们带来很大的困扰那么这个问题是什么原因导致的呢又应
冒泡排序/选择排序/插入排序/快速排序/归并排序/桶排序/堆排序/希尔排序/计数排序/基数排序/二分查找/广度优先搜索/深度优先搜索

排序算法冒泡排序 Bubble Sort 通过重复地比较相邻的元素并交换它们使得最大或最小的元素逐渐移动到列表的一端从而实现排序选择排序 Selection Sort 在未排序的部分中选择最小或最大的元素并将其放置在已排
使用 Helm Chart 部署分布式 GreptimeDB

GreptimeDB 作为云时代基础设施的时序数据库从第一天开始就积极拥抱云原生技术将数据库部署在 Kubernetes 上可以提供可伸缩性自愈能力和简化的部署和管理从而为应用程序提供了强大的弹性和可靠性 Helm 是一个用于管理
解决IOS上架App Store后显示语言为英文的问题

文章目录问题网页端App Store显示 PC端App Store 手机端App Store 解决方法 Flutter中配置 IOS中配置
STS、CTS、GTS、VTS测试指南

Android Security Test Suite STS 是谷歌关于android安全补丁安装情况的一个测试套件STS和security patch相关的是CTS测试新增加一项安全测试套件 STS是201808才开始测试的 Secu
网站被攻击了怎么恢复？如何在被攻击后第一时间接入高防恢复正常访问?

网站受到攻击的原因是多种多样的包括技术漏洞人为疏忽社会工程学等各种因素保护网站的安全需要综合运用技术手段当网站遭到攻击时以下几个步骤可以帮助恢复网站的正常运行 1 分析攻击首先要确认网站被攻击的类型和程度以确定所需的恢复步骤
IDEA中也能用Postman了，这款插件平替

Postman是大家最常用的API调试工具那么有没有一种方法可以不用手动写入接口到Postman 即可进行接口调试操作今天给大家推荐一款IDEA插件 Apipost Helper 写完代码就可以调试接口并一键生成接口文档而且还可以根据
服务器数据恢复-昆腾存储StorNext文件系统下raid5数据恢复案例

服务器数据恢复环境昆腾某型号存储 StorNext文件存储系统共有9个分别配置了24块磁盘的磁盘柜其中8个磁盘柜存放普通数据 1个磁盘柜存放元数据存放元数据的磁盘柜中的24块磁盘组建了8组RAID1阵列和1组4盘RAID10阵列还
基于PySide6的简易单位转换器

制作一个简易的长度和重量单位转换器在qtdesigner中设计如下的界面下图为全部控件和整体布局也可以直接复制下面代码下面是整个ui界面的 ui文件将其在vscode中新建后使用工具进行编译生成py文件即可由于上面控件中计算按钮
C++ AVL树(四种旋转,插入)

C AVL树四种旋转插入一 AVL树的概念及性质二我们要实现的大致框架 1 AVL树的节点定义 2 AVL树的大致框架三插入 1 插入逻辑跟BST相同的那一部分 2 修改平衡因子
在scrapy 使用selenium模拟登录获取cookie

前言最近有一点点爬虫需求想总结一下scrapy框架的一些基本使用方法加深印象自己一直习惯使用一些脚本文件运行爬虫面对数据量非常大稳定性要求比较高的效率需求比较高的情况下还是用scrapy较为合适 scrapy是一个异步的框架
【转载】【有用】gitee 拉取或push 代码https 协议的地址发生证书错误的解决（server certificate verification failed. CAfile: /etc/s）

问题描述从GitHub地址下载内容提示服务器证书验证失败没有CRLfile curl 60 server certificate verification failed CAfile etc ssl certs ca certific
ChatGLM3-6B 的调用参数说明，chat 与stream_chat 接口函数的参数说明

ChatGLM3 6B 是一个语言大模型最近在评估这个模型但发现它的文档有限只能从demo代码中猜测调用的参数的含义准确度是有限的于是通过查看源代码来研究目前整理笔记如下 ChatGLM3 6B 的调用接口有两个一个是cha
vue3+ant 之年份组件

ant design 框架里的年份组件效果图
一文解决idea导入源码控制台爆红问题

文章目录唠嗑部分背景说明 idea查看maven配置言归正传安装maven
医院绩效核算系统源码，java语言开发

医院绩效考核系统全套源码医院绩效核算系统源码 java语言开发医院绩效考核系统可根据工作绩效考核管理规定配置相应的绩效考核模型从工作量统计核算维度核算权重三方面计算工作绩效利用数据处理和数据分析的支撑作用实现对工作量统计和绩
多表插入、删除操作（批量）——后端

多表插入场景当添加一个菜品时还需要记录菜品的口味信息因此需要对菜品表 dish 和口味表 dish flavor 同时进行插入操作两个表的字段代码思路由DishController将前端的请求派发给相应的业务层 DishSer
vue3封装年份组件

ant框架年份组件看了ant框架针对于年份不能自定义插槽内容所以放弃用ant框架年份组件自定义插槽内容是想实现年份下方可以加小圆点的需求因加小圆点需求必须实现决定自己封装组件来实现需求自己实现的效果呢类似于ant年份控件在这里做
用户管理第2节课--idea 2023.2 后端--实现基本数据库操作(操作user表)

一模型user对象 gt 和数据库的字段关联自动生成其中涉及删除表数据一切又从零开始二模型user对象 gt 和数据库的字段关联 2 1在model文件夹下新建 user对象 2 1 1 概念大家可以想象我们现在的数据是存储
ResNet实战：CIFAR-10数据集分类

本节将使用ResNet实现CIFAR 10数据集分类 7 2 1 CIFAR 10 数据集简介 CIFAR 10数据集共有60000幅彩色图像这些图像是32 32像素的分为10个类每类6000幅图这里面有50000幅用于训练构成了

ResNet实战：CIFAR-10数据集分类

ResNet实战：CIFAR-10数据集分类 的相关文章

随机推荐

热门标签

ResNet实战：CIFAR-10数据集分类的相关文章