人工智能学习:MNIST数据分类识别神经网络(2)

2023-05-16

在MNIST数据集上构建一个神经网络,进行训练,以达到良好的识别效果

1 导入模块
首先,导入必要的模块

import numpy as np

import tensorflow as tf
from tensorflow import keras
from keras import models, layers

import matplotlib.pyplot as plt

2 下载数据集
然后,载入MNIST数据集,并进行数据预处理,以适用于训练

# load MNIST dataset
(train_images, train_labels), (test_images, test_labels) = keras.datasets.mnist.load_data()

# train_images: 60000*28*28, train_labels: 60000*1
# test_images: 10000*28*28, test_labels: 10000*1

# pre-process data, change data shape & type
train_input = train_images.reshape(60000,28*28)
train_input = train_input.astype('float32')/255
test_input = test_images.reshape(10000,28*28)
test_input = test_input.astype('float32')/255

train_output = keras.utils.to_categorical(train_labels)
test_output = keras.utils.to_categorical(test_labels)

其中,图片(28,28)二维数据被归一化到784(28*28)的一维数据。以适应神经网络的输入维度。并且0-255之间的灰度图取值归一化到0-1之间的浮点数。输出的类别数据(0-9)转化为分类数据,即0-9的数字转化为长度为10的向量,在对应分类的元素置为1,其它为0。比如

数值5 转化为 [0,0,0,0,0,1,0,0,0,0,0]

3 构造神经网络
然后,搭建神经网络

# build model
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28*28,)))
network.add(layers.Dense(10, activation='softmax'))

network.compile(optimizer='rmsprop',loss='categorical_crossentropy',metrics=['accuracy'])

#show network summary
network.summary()

这段代码的输出为网络的结构信息,如下

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
dense (Dense)                (None, 512)               401920    
_________________________________________________________________
dense_1 (Dense)              (None, 10)                5130      
=================================================================
Total params: 407,050
Trainable params: 407,050
Non-trainable params: 0
_________________________________________________________________

为一个由两个全连接层构成的神经网络,第一层的输入为784,输出为512,采用relu激活函数;第二层的输出为10,采用softmax激活函数。输出表示结果分别为0-9数值的概率。

4 训练神经网络
模型的训练调用函数

# train, with batch size and epochs
network.fit(train_input, train_output, epochs=10, batch_size=128)

指定训练的次数(epochs)和每批次的训练数据量(batch_size)。batch_size表示每次取多少数据来进行一次训练。epochs表示进行多少次在输入数据集上的训练。训练产生结果如下

Epoch 1/10
469/469 [==============================] - 3s 2ms/step - loss: 0.2534 - accuracy: 0.9258
Epoch 2/10
469/469 [==============================] - 1s 2ms/step - loss: 0.1030 - accuracy: 0.9690
Epoch 3/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0679 - accuracy: 0.9798
Epoch 4/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0496 - accuracy: 0.9856
Epoch 5/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0373 - accuracy: 0.9886
Epoch 6/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0292 - accuracy: 0.9913
Epoch 7/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0224 - accuracy: 0.9934
Epoch 8/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0174 - accuracy: 0.9946
Epoch 9/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0130 - accuracy: 0.9964
Epoch 10/10
469/469 [==============================] - 1s 2ms/step - loss: 0.0103 - accuracy: 0.9969

列出了每次训练的损失函数值(loss)和准确率(accuracy)。能够达到0.9969。

5 评估神经网络
训练完成后,在测试集上进行评估

# evaluate network performance using test data
network.evaluate(test_input, test_output)

结果如下

313/313 [==============================] - 1s 1ms/step - loss: 0.0735 - accuracy: 0.9806
[0.0734768807888031, 0.9805999994277954]

显示在测试集上的损失函数值和准确率。准确率为0.9806。

这里通过画图显示前100张图片推理结果

# perform prediction on test data
predict_output = network.predict(test_input)

# lines and columns of subplots
m = 10
n = 10
num = m*n

# figure size
plt.figure(figsize=(11,11))

# plot first 100 pictures of test images and results
for i in range(num):
    plt.subplot(m,n,i+1)
    
    cmap = 'gray_r' if np.argmax(predict_output[i]) == np.argmax(test_output[i]) else 'gray'
                 
    plt.imshow(test_images[i], cmap=cmap)
    plt.xticks([])
    plt.yticks([])

plt.show()

推理正确的显示为白底的图片,推理错误的显示为黑色背景的图片。运行结果如下
在这里插入图片描述
前100张出现1张错误识别的图像。

参考链接:https://blog.csdn.net/weixin_45825073/article/details/121753882

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能学习:MNIST数据分类识别神经网络(2) 的相关文章

随机推荐

  • 在Jetson Nano安装测试YOLO v5目标识别示例

    参考链接 https blog csdn net carrymingteng article details 120978053 https blog csdn net weixin 43947712 article details 115
  • 问题解决:ImportError: The _imagingft C module is not installed

    在测试YOLO v5时出现错误提示 xff1a ImportError The imagingft C module is not installed 经查是pillow库的问题 解决方法 重新安装pillow xff0c 先卸载已有的pi
  • Jetson Nano设置风扇自启动

    Jetson Nano跑一些如目标识别等需要较大计算量的程序 xff0c 散热板会非常的热 xff0c 为避免主板过热 xff0c 通常在散热板上加装一个风扇增强散热 风扇需要软件指令进行驱动 xff0c 驱动风扇的指令为 sudo sh
  • Ubuntu 18.04安装gazebo9

    首先 xff0c 把gazebo的源添加到apt的source list中 sudo sh c echo deb http packages osrfoundation org gazebo ubuntu stable 96 lsb rel
  • 问题解决:/usr/bin/ld: cannot find -lbz2

    在项目编译过程中 xff0c 出现类似如下的错误 usr bin ld cannot find lbz2 经查询 xff0c 是找不到bz2的库文件 xff0c 用whereis命令查询 whereis libbz2 找不到对应的库文件 x
  • 常用Git命令

    通过git命令可以对项目代码库执行克隆 拉取 提交等操作 常用的git命令有如下 git clone 克隆代码库 xff0c 把远程代码库克隆到本机当前目录 xff0c 如 git clone https github com PX4 PX
  • 【Android】原来Toolbar还能这么用?Toolbar使用最全解析。网友:终于不用老是自定义标题栏啦

    一个Toolbar的UI可以做成什么样 xff1f 做出什么效果 xff1f 这是我最近在研究的问题 目录 带导航图标的Toolbar带标题的Toolbar带小标题的Toolbar带Logo的Toolbar带进度条的Toolbar带菜单的T
  • Linux安装Beyond Compare

    Beyond Compare是一款很好用的代码比对软件 xff0c 提供了在Windows xff0c Linux等平台的安装包 在Linux下安装Beyond Compare的方法如下 参考链接 xff1a https www scoot
  • Linux下压缩解压文件和目录的方法(zip, tar)

    Linux下可以用zip命令方便的压缩文件或文件夹 压缩文件 zip data zip data xls zip data zip data1 xls data2 xls 上述命令把一个文件或者多个文件压缩到一个zip文件 压缩目录 zip
  • Jupyter Notebook安装

    Jupyter Notebook是一个非常好用的交互式Python运行的软件 安装方法如下 在命令行输入 pip3 install jupyter 安装后根据提示 xff0c Jupyter相关软件安装在 local bin目录下 xff0
  • Ubuntu添加截屏快捷键的方法

    在Ubuntu下面具有截屏的命令 xff08 gnome screenshot xff09 xff0c 可以通过简单的设置方便的添加截屏快捷键 通过 Settings gt Devices gt Keyboard选项 xff0c 添加快捷键
  • Windows下修改Jupyter Notebook默认字体的方法(custom.css)

    在Windows下Jupyter Notebook代码显示的默认字体为宋体 xff0c 视觉效果不是很好 xff0c 可以通过设置修改默认的显示字体 通过用户目录 C User Administrator jupyter custom 下的
  • Jupyter Notebook添加代码自动补全功能的方法

    Jupyter Notebook成为一款非常受欢迎的交互式Python运行环境的软件 通过如下的方法可以添加代码自动补全的功能 输入命令安装插件 pip3 install jupyter contrib nbextensions 然后运行
  • 修改grub默认启动选项的方法

    在Windows系统基础上 xff0c 再安装Linux xff0c 形成双系统 这样在grub启动菜单中会包含Linux Windows等多个选项 xff0c 默认为第一个选项 xff0c 常规的Linux启动 通过修改配置文件 etc
  • 在云服务器上搭建Jupyter Notebook服务

    Jupyter Notebook提供了远程登录的功能 xff0c 可以在云服务器上配置Jupyter Notebook xff0c 用户可以远程登录和运行Python代码 这里使用的是腾讯云的Ubuntu服务器 xff0c 配置方法如下 1
  • 常用Linux命令

    记录一些常用的Linux命令 1 用户管理 增加用户 useradd lt user name gt useradd g lt group name gt lt user name gt g选项指定新用户所属的用户组 修改用户的组别 use
  • 在云服务器上安装VNC远程桌面服务

    云服务器操作系统通常不包含图形界面 xff0c 通过在服务器上安装VNC服务 xff0c 可以让用户以图形化界面远程登录到云服务器 这里服务器使用的是Ubuntu Server 18 04系统 1 安装图形界面 首先在服务器端安装图形化桌面
  • 【Android】ADB无线连接Android设备

    目录 简介无线连接的条件adb连接设备方法一方法二 修改端口号方法一方法二 辅助工具android toolscrcpy gui 问题集合 简介 Android Debug Bridge xff0c 简称adb xff0c 是一种功能多样的
  • 人工智能学习:载入MNIST数据集(1)

    MNIST数据集是人工智能学习入门的数据集 xff0c 包含了一系列的手写的数字图片 载入MNIST数据集的方法很简单 xff0c Tensorflow集成了载入数据集的方法 首先导入tensorflow模块和matplotlib pypl
  • 人工智能学习:MNIST数据分类识别神经网络(2)

    在MNIST数据集上构建一个神经网络 xff0c 进行训练 xff0c 以达到良好的识别效果 1 导入模块 首先 xff0c 导入必要的模块 span class token keyword import span numpy span c