基于ResNet50算法实现图像分类识别

2023-11-14

概要

 

在本文中将介绍使用Python语言,基于TensorFlow搭建ResNet50卷积神经网络对四种动物图像数据集进行训练,观察其模型训练效果。

 

一、目录

  • ResNet50介绍

  • 图片模型训练预测

  • 项目扩展

 

二、ResNet50介绍

ResNet50是一种基于深度卷积神经网络(Convolutional Neural Network,CNN)的图像分类算法。它是由微软研究院的Kaiming He等人于2015年提出的,是ResNet系列中的一个重要成员。ResNet50相比于传统的CNN模型具有更深的网络结构,通过引入残差连接(residual connection)解决了深层网络训练过程中的梯度消失问题,有效提升了模型的性能。

  1. 深度卷积神经网络(CNN) CNN是一种专门用于图像处理的神经网络结构,具有层次化的特征提取能力。它通过交替使用卷积层、池化层和激活函数层,逐层地提取图像的特征,从而实现对图像的分类、检测等任务。然而,当网络结构变得非常深时,CNN模型容易面临梯度消失和模型退化的问题。

  2. 残差连接(Residual Connection) 残差连接是ResNet50的核心思想之一。在传统的CNN模型中,网络层之间的信息流是依次通过前一层到后一层,而且每一层的输出都需要经过激活函数处理。这种顺序传递信息的方式容易导致梯度消失的问题,尤其是在深层网络中。ResNet50通过在网络中引入残差连接,允许信息在网络层之间直接跳跃传递,从而解决了梯度消失的问题。

  3. 残差块(Residual Block) ResNet50中的基本构建块是残差块。每个残差块由两个卷积层组成,这两个卷积层分别称为主路径(main path)和跳跃连接(shortcut connection)。主路径中的卷积层用于提取特征,而跳跃连接直接将输入信息传递到主路径的输出上。通过将输入与主路径的输出相加,实现了信息的残差学习。此外,每个残差块中还使用批量归一化(Batch Normalization)和激活函数(如ReLU)来进一步提升模型的性能。

  4. ResNet50网络结构 ResNet50网络由多个残差块组成,其中包括了一些附加的层,如池化层和全连接层。整个网络的结构非常深,并且具有很强的特征提取能力。在ResNet50中,使用了50个卷积层,因此得名ResNet50。这些卷积层以不同的尺寸和深度对图像进行特征提取,使得模型能够捕捉到不同层次的特征。

三、模型训练预测

在本文中选取了常见的四种动物数据(猫、狗、马、鸡),文件夹结构如下图所示。

2ed59d07a4fd4421ad3d9549d55c5cfd.png

fe577a5925604abca176f605fb1c48df.png

在完成数据集的收集准备后,打开jupyter notebook平台,导入数据集通过以下代码可以计算出数据集的总图片数量。本次使用的数据集总图片为4000张。

import pathlib

data_dir = "./dataset/"
data_dir = pathlib.Path(data_dir)
image_count = len(list(data_dir.glob('*/*')))
print("图片总数为:",image_count)

然后划分TensorFlow的image_dataset_from_directory方法划分测试集和训练集。再构建模型。在本文中如下图所示

# 加载resnet50模型
model = keras.applications.ResNet50(weights='imagenet', include_top=True)

这段代码的目的是使用Keras库加载预训练的ResNet50模型,并将其应用于图像分类任务。

具体解释如下:

  • keras.applications.ResNet50: 这是Keras库中的一个函数,用于加载ResNet50模型。ResNet50是一个已经定义好的模型架构,包含了数十个卷积层、池化层和全连接层,用于图像分类任务。

  • weights='imagenet': 这个参数指定了模型所使用的权重。'imagenet'是一个大规模的图像数据集,ResNet50在该数据集上进行了预训练,因此通过设置这个参数,我们可以加载已经在该数据集上训练好的权重。这样的预训练权重可以提供较好的特征表示能力,有助于提升模型在图像分类任务上的性能。

  • include_top=True: 这个参数指定是否包含模型的顶层(即全连接层)。当设置为True时,加载的模型将包含原始ResNet50模型的所有层,包括最后的全连接层,用于输出分类结果。如果我们只需要使用ResNet50的特征提取能力而不需要分类层,则可以将该参数设置为False。

然后开始训练,其训练过程如下图所示

1b979f753a124110ab97ce91b286bfe3.png

通过上图可知,通过20轮迭代训练,在最后一轮迭代完成后,模型在测试集上面的精度为0.9875,精度还是非常高的。接下来就是打印下ACC曲线图和LOSS曲线图以及混淆矩阵图等。通过图片可知,算法的拟合度还是比较理想的。

dca5e0ba65ff4c58ae06d97e356d8c4b.png

 947e02b21bf645d78a43d77b47995acc.png

 69dbe35fcd7d4838b7c271e211eea0ba.png

 

三、项目扩展

在完成模型训练后,通过model.save方法保存模型为本地文件,然后就可以基于改模型开发出非常多的应用了,比如开发出API接口给别人调用等。

 

今天的分享就到这里,欢迎点赞收藏转发,感谢

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于ResNet50算法实现图像分类识别 的相关文章

  • 如何在Python中循环并存储自变量中的值

    我对 python 很陌生 所以这听起来可能很愚蠢 我进行了搜索 但没有找到解决方案 我在 python 中有一个名为 ExcRng 的函数 我可以对该函数执行什么样的 for 循环 以便将值存储在独立变量中 我不想将它们存储在列表中 而是
  • Tensorflow 可变图像输入大小(自动编码器、放大......)

    Edit WARNING不建议使用不同图像大小的图像 因为张量需要具有相同的大小才能实现并行化 我一直在寻找解决方案 了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而 由于每个图像的大小不同 我无法
  • 如何从 PyCharm 项目中获取我的“exe”[重复]

    这个问题在这里已经有答案了 通过 PyCharm 在 Python 上编写一些项目 我想从中获取一个exe文件 我尝试过 另存为 gt XXX exe 但是 当我尝试执行它时出现错误 此类操作系统不支持该文件 附注 我有win7 x64 它
  • python 中分割字符串以获得一个值?

    需要帮助 假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作 我得到两个具有不同字符串 Sam 和 Person 的变量 有没有办法只获取第一个值 name S
  • 带图像的简单 GUI [关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
  • 为什么 Python 中的“pip install”会引发语法错误?

    我正在尝试使用 pip 安装软件包 我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误 如何使用 pip 安装软件包 gt gt gt pip install selenium
  • 如何限制Django CreateView中ForeignKey字段的选择?

    我有一个沿着这些思路的模型结构 models py class Foo models Model class Bar models Model foo models ForeignKey Foo class Baz models Model
  • 无法打开 Python。错误 0xc000007b

    我最近一直在学习 Python 3 我在我的上网本 32 位 Windows 7 上创建简单的小程序没有任何问题 当我将它安装在我的上网本上时 我没有遇到任何问题 但现在我已经开始使用它了 我想将它安装在我的台式机上 并且我有一个 我的桌面
  • matplotlib matshow 标签

    我一个月前开始使用 matplotlib 所以我仍在学习 我正在尝试用 matshow 制作热图 我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
  • 在可编辑的QSqlQueryModel中实现setEditStrategy

    这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里 我们创建了 QSqlQueryModel 的可
  • Pandas Dataframe:将包含列表的行扩展到多行,并为所有列提供所需的索引

    我在 pandas 数据框中有时间序列数据 索引为测量开始时的时间 列中包含以固定采样率记录的值列表 连续索引 列表中元素数量的差异 这是它的样子 Time A B Z 0 1 2 3 4 1 2 3 4 2 5 6 7 8 5 6 7 8
  • 在 MacO 和 Linux 上安装 win32com [重复]

    这个问题在这里已经有答案了 我的问题很简单 我可以安装吗win32com蟒蛇API pywin32特别是 在非 Windows 操作系统上 我一直在Mac上尝试多个版本pip install pywin32 都失败了 下面是一个例子 如果你
  • Airflow Python 单元测试?

    我想为我们的 DAG 添加一些单元测试 但找不到任何单元测试 有 DAG 单元测试框架吗 有一个端到端的测试框架存在 但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
  • 查找给定节点的最高权重边

    我在 NetworkX 中有一个有向图 边缘的权重从 0 到 1 表示它们发生的概率 网络连通性非常高 所以我想修剪每个节点的边缘 只保留最高概率的节点 我不确定如何迭代每个节点并仅保留最高权重in edges在图中 有没有一个networ
  • 如何通过字符串匹配加速 pandas 行过滤?

    我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作 有没有快速的方法可以做到这一点 例如 In 1 df mul df 3000 2000 3 reset inde
  • Python - 如何查询定义方法的类?

    我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
  • 如何在sphinx中启用数学?

    我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
  • 如何禁止 celery 中的 pickle 序列化

    Celery 默认使用 pickle 作为任务的序列化方法 如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
  • 使用 Python 生成类似于 Messenger 或 kik 代码的圆形二维码

    我可以使用 Python 生成圆形 QR 码 就像 Facebook Messenger 或 kik 使用的那样吗 我访问了很多网站 但找不到这种类型的二维码 默认情况下 Python 生成方形 QR 码 但在我的项目中我想要圆形 QR 码
  • Django South - 将 null=True 字段转换为 null=False 字段

    我的问题是 转变的最佳做法是什么null True场变成null False使用 Django South 的字段 具体来说 我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

  • 常见的数据增强方式

    详见 Pytorch基础学习 第二章 Pytorch数据处理 Billie使劲学的博客 CSDN博客 pytorch 数据集处理
  • AI软件克隆你的声音,全球诈骗案件已屡次得逞!

    在2月28号刚于旧金山结束的RSA大会上 一家名为Pindrop的专门检测语音诈骗的初创公司再次向业内发出警告 网络诈骗份子已经开始借助AI软件克隆声音进行诈骗了 Pindrop的CEO 右 和CTO 左 图片来自网络 Pindrop的CE
  • Jupyter Notebook修改背景添加jupyterthemes后,输入‘jt -l‘,报错‘jt‘ 不是内部或外部命令,也不是可运行的程序

    目录 1 报错原因 2 继续操作 1 报错原因 jupyterthemes 装到了C Users bs AppData Roaming Python Python37 site packages中 然而 这个路径并不在环境变量的PATH变量
  • artipub点击“更新cookie状态“无任何反应

    作者 弗拉德 来源 弗拉德 公众号 fulade me artipub ArtiPub Article Publisher 的简称 意为 文章发布者 是一款开源的一文多发平台 可以帮助文章作者将编写好的文章自动发布到掘金 SegmentFa
  • jQuery的todolist案例实现

    想必大家都需要记录一些小事情 类似于记录生活 以后还能翻出来看看 本次就可以用jQuery来实现一下 对于本案例其实也不难 无非是一个增删查改加上本地存储缓存机制来实现的操作 下面就给出代码相关分析 相关样式资源可以私下找我 QQ35349
  • 如何杀掉其他人远程ssh的进程

    执行w 看当前远程的终端 执行pkill kill t pts 3 杀死pts 3的 ssh进程
  • VScode配置C/C++环境,MinGW,最新成功实例分享(win10)

    win10 VScode配置C语言 自己调试成功后 分享出来 首先下载VScode 这个十分简单 直接官网搜索最新的就行了 VScode下载官网VScode下载官网 然后安装 其中windows下支持C语言的编译 有两个好用的分别是MinG
  • 什么是Docker

    文章目录 一 什么是Docker 一 什么是Docker 微服务虽然具备各种各样的优势 但服务的拆分通用给部署带来了很大的麻烦 特别是一些大型项目组件较多 运行环境也较为复杂 部署时会碰到一些问题 依赖关系复杂 容易出现兼容性问题 分布式系
  • 简单使用matlab做回归分析、拟合分析

    简单使用matlab做回归分析 拟合分析 前言 一元线非线性回归 例子 多元线性回归 例子 多元线非线性回归 前言 这里是简单做一元非线性 及多元线性 一元 就是只有一个X 比如 y x 2 x 1 多元 就是多个X 比如 y x1 x2
  • Unity 小球在两点之间往返运动

    在Vectoer3类中有一个Lerp方法 可以让一个物体从一个点到另外一个点 如果要在 这里点加往返运动我们可以借助Mathf PingPong 这个方法 这个方法会从0 Lenght持续增加 达到最大值后 持续减小 然后到0 如此反复 每
  • 基于协同过滤算法实现选课推荐系统

    新版本教务管理系统 教务管理系统 选课功能 1 系统功能 1 用户账户管理 2 学生个人信息的查看与修改 3 学生的网上选课与课程的评分 4 教师个人信息的查看与修改 5 教师对学生课程评价结果的查看 6 管理员对学生信息与教师信息的查看与
  • 前端绘制地铁路线图

    前端绘制地铁路线图 前端可以使用多种技术绘制二维地图 以下是几种常见的方法 SVG SVG是一种基于XML的矢量图形格式 可以使用SVG元素绘制各种形状和路径 包括线 圆 多边形等 可以使用JavaScript库如D3 js来绘制SVG地图
  • 【推荐系统】{1} —— 基于用户的协同过滤算法

    协同过滤 英语 Collaborative Filtering 简称CF 简单来说是利用某兴趣相投 拥有共同经验之群体的喜好来推荐用户感兴趣的信息 个人透过合作的机制给予信息相当程度的回应 如评分 并记录下来以达到过滤的目的进而帮助别人筛选
  • 【Pytorch】Inplace operation(待完善)

    什么是Inplace操作 本质上讲 inplace操作是指将新值赋到原变量地址上的操作 目的是节约内存空间 例如inplace操作 x 1 假设原x值为0 储存在id为139973228650216的内存地址中 在进行该inplace操作后
  • 【LeetCode每日刷题】一单词长度的最大乘积

    一 题目 给定一个字符串数组 words 请计算当两个字符串 words i 和 words j 不包含相同字符时 它们长度的乘积的最大值 假设字符串中只包含英语的小写字母 如果没有不包含相同字符的一对字符串 返回 0 输入输出样例 示例1
  • LVS、Nginx、HAProxy、keepalive 的工作原理详解

    当前大多数的互联网系统都使用了服务器集群技术 集群是将相同服务部署在多台服务器上构成一个集群整体对外提供服务 这些集群可以是 Web 应用服务器集群 也可以是数据库服务器集群 还可以是分布式缓存服务器集群等等 在实际应用中 在 Web 服务
  • 阿里云ACK(容器服务)+ElasticWorkload弹性负载+HPA弹性伸缩实践

    背景 阿里云ACK kubernetes容器服务 高弹性 高稳定性 低成本解决方案 通过将ECI服务以虚拟节点的方式接入ACK容器集群 将集群中pod应用的固定量调度到现有的ACK容器服务的ECS node节点上 将集群中pod应用的弹性量
  • 测试用例要如何写

    1 测试点与测试用例 测试点不等于测试用例 这是我们首先需要认识到的 问题1 这些测试点在内容上有重复 存在冗余 问题2 一些测试点的测试输入不明确 不知道测试时要测试哪些 问题3 总是在搭相似的环境 做类似的操作 问题4 测试点描述得太粗
  • CWnd和HWND的区别

    所有控件类都是CWnd类的派生类 CWnd的所有成员函数在控件类中都可以使用 在MFC中 CWnd类是一个很重要的类 它封装了Windows的窗口句柄HWND 在Windows编程中 每一个窗口都是有窗口句柄标识的 但是 类CWnd的对象和
  • 基于ResNet50算法实现图像分类识别

    概要 在本文中将介绍使用Python语言 基于TensorFlow搭建ResNet50卷积神经网络对四种动物图像数据集进行训练 观察其模型训练效果 一 目录 ResNet50介绍 图片模型训练预测 项目扩展 二 ResNet50介绍 Res
Powered by Hwhale