本次设计的主题是花卉识别,数据为TensorFlow的官方数据集flower_photos,包括5种花卉(雏菊、蒲公英、玫瑰、向日葵和郁金香)的图片,并有对应类别的标识(daisy、dandelion、roses、sunflowers、tulips)
数据集内容举例: 数据集tgz文件解压后,内部划分为5个相对应的文件夹,文件夹内为相对应图片: 对应样本数(对数据集进行分类,90%训练集,10%验证集):
本次设计的任务是通过所提供的数据集数据(具有对应花卉分类),使用神经网络模型方法进行训练,使用该模型对其它同类花卉进行类型识别,需要借助TensorFlow环境下的神经网络模型进行处理训练。 本次设计任务我将使用TensorFlow环境下的卷积神经网络CNN技术,通过CNN对数据集进行对应的训练,建立相关模型,再使用模型对相对应花卉进行识别。其中神经网络的建立使用TensorFlow 2.x的Keras的Api进行搭建,绘制损失函数和准确率曲线对模型训练效果进行评价,训练完成保存为mode.h5文件储存,在预测数据时读取model文件加载model,再使用model进行预测数据,并使用Pyqt5工具设计一个简洁的GUI界面进行人机交互,能够自定义预测数据集图片。
本次设计使用TensorFlow 2.3,Python 3.8 环境,IDE使用PyCharm,进行神经网络的搭建和训练。
1、设置图片尺寸为180*180,分批大小32
2、从flower_photos文件夹中加载数据: (train_ds为训练集,val_ds为验证集) 使用tf.keras.preprocessing.image_dataset_from_directory方法,其中参数: Directory:数据集储存文件夹路径 Validate_split:划分训练集和验证集比例,输入0.1为验证集占10% Subset:training为训练集,validation为验证集 Seed:用于shuffle和转换的可选随机种子,选择123 Image_size:图片大小,为上一点所预设180*180 Batch_size:数据批次的大小,为预设的32 3、获取分类名: 结果:
4、数据可视化演示: 5、配置数据集: • 使用shuffle()函数打乱数据,使用cache()函数将数据集缓存到内存当中, 再使用prefetch()函数预取数据,加速运行
第1层:输入层:将数据归一化,并设置input_shape输入 第2层:卷积层1:卷积核数目为16,卷积核为3*3,激活函数为relu,并设置input_shape为(180,180,3),使用卷积的目的是从输入图片中提取特征
第3层:池化层1:采用最大池化操作,使用2*2采样,池化层的目的是降低了每个特征映射的维度,但是保留最重要的信息
第4层:卷积层2:卷积核数目为32,卷积核为3*3,激活函数为relu
第5层:池化层2:采用最大池化操作,使用2*2采样
第6层:卷积层3:卷积核数目为64,卷积核为3*3,激活函数为relu
第7-10层:两个卷积层和池化层
第11层:Flatten层:连接卷积层与全连接层,把多维的输入一维化
第12层:全连接层:units设置为128,即输出维度为128,,激活函数为relu,全连接层对上一层的神经元进行全部连接,实现特征的非线性组合,进行特征进一步提取
第13层:输出层:输出预期结果
使用Sequential逐层描述每层网络, 搭建神经网络结构: 打印网络结构:
1、模型编译: 优化器optimizer选adam,损失函数loss选SparseCategoricalCrossentropy,指标metrics选择准确率accuracy 2、训练模型 指定训练集train_ds,验证集validation_data为val_ds,迭代10次 3、训练结束,保存model为model.h5 4、使用evaluate评价模型,并打印准确率 5、获取准确率和损失值并绘制函数 6、绘制混淆矩阵:
1、定义常量: Flower_dict为花卉种类序列,以及图片宽高
2、加载模型 3、根据方法参数path加载图片数据转为array类型,由于维度问题需要扩展1维,使用numpy的expand_dims方法将数据由3维扩展为4维,然后使用model.predict方法将图片数据作为参数调用,返回result结果(index)对应flower_dict相对应index,返回对应index的种类名作为结果
1、使用Pyqt5工具设计GUI界面: 2、使用Pyqt5生成ui代码: 部分:
3、编写主函数Main.py ①import 组件
②打开GUI界面,初始化
③定义训练和预测函数:
单独选择图片进行预测时,由于图片数据维度问题需要扩展1维,使用numpy的expand_dims方法将数据由3维扩展为4维,然后使用model.predict方法将图片数据作为参数调用
优化CNN网络处理,防止过拟合,提高模型的泛化能力
初始页面选训练: 1、网络结构
2、迭代过程
3、数据可视化
4、准确率
5、损失函数
6、混淆矩阵:
7、GUI演示 点击识别
选择图片 识别成功 Gitee源码: https://gitee.com/steven_L1047/tensor-flow.git.