TensorFlow学习笔记(八)—— TensorFlow基于MNIST数据集识别手写数字

2023-11-09

训练程序

参照Tensorflow中文社区教程:
http://www.tensorfly.cn/tfdoc/tutorials/mnist_pros.html


能在自己的环境中成功运行代码。
(注意一点:关于教程的print函数)

在博主用的Python3.6版本中,print已经成为了一个函数,而在Python2.7当中print不是一个函数,这里博主是需要加上括号。
所以根据自己所用的版本,更改这里,例如

print("Hello")  python3.6
print "Hello"   python2.7

按照教程将代码跑通之后,接下来就是将模型保存,只需调用一个简单的函数saver.save,以下就是博主根据教程敲得完整代码:

from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf
#读取数据
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)
sess=tf.InteractiveSession()
#构建cnn网络结构
#自定义卷积函数(后面卷积时就不用写太多)
def conv2d(x,w):
    return tf.nn.conv2d(x,w,strides=[1,1,1,1],padding='SAME')
#自定义池化函数
def max_pool_2x2(x):
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')
#设置占位符,尺寸为样本输入和输出的尺寸
x=tf.placeholder(tf.float32,[None,784])
y_=tf.placeholder(tf.float32,[None,10])
x_img=tf.reshape(x,[-1,28,28,1])

#设置第一个卷积层和池化层
w_conv1=tf.Variable(tf.truncated_normal([3,3,1,32],stddev=0.1))
b_conv1=tf.Variable(tf.constant(0.1,shape=[32]))
h_conv1=tf.nn.relu(conv2d(x_img,w_conv1)+b_conv1)
h_pool1=max_pool_2x2(h_conv1)

#设置第二个卷积层和池化层
w_conv2=tf.Variable(tf.truncated_normal([3,3,32,50],stddev=0.1))
b_conv2=tf.Variable(tf.constant(0.1,shape=[50]))
h_conv2=tf.nn.relu(conv2d(h_pool1,w_conv2)+b_conv2)
h_pool2=max_pool_2x2(h_conv2)

#设置第一个全连接层
w_fc1=tf.Variable(tf.truncated_normal([7*7*50,1024],stddev=0.1))
b_fc1=tf.Variable(tf.constant(0.1,shape=[1024]))
h_pool2_flat=tf.reshape(h_pool2,[-1,7*7*50])
h_fc1=tf.nn.relu(tf.matmul(h_pool2_flat,w_fc1)+b_fc1)

#dropout(随机权重失活)
keep_prob=tf.placeholder(tf.float32)
h_fc1_drop=tf.nn.dropout(h_fc1,keep_prob)

#设置第二个全连接层
w_fc2=tf.Variable(tf.truncated_normal([1024,10],stddev=0.1))
b_fc2=tf.Variable(tf.constant(0.1,shape=[10]))
y_out=tf.nn.softmax(tf.matmul(h_fc1_drop,w_fc2)+b_fc2)

#建立loss function,为交叉熵
loss=tf.reduce_mean(-tf.reduce_sum(y_*tf.log(y_out),reduction_indices=[1]))
#配置Adam优化器,学习速率为1e-4
train_step=tf.train.AdamOptimizer(1e-4).minimize(loss)

#建立正确率计算表达式
correct_prediction=tf.equal(tf.argmax(y_out,1),tf.argmax(y_,1))
accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

# 定义saver
saver = tf.train.Saver()

#开始喂数据,训练
tf.global_variables_initializer().run()
for i in range(20000):
    batch=mnist.train.next_batch(50)
    if i%100==0:
        train_accuracy=accuracy.eval(feed_dict={x:batch[0],y_:batch[1],keep_prob:1})
        print("step %d,train_accuracy= %g"%(i,train_accuracy))
    train_step.run(feed_dict={x:batch[0],y_:batch[1],keep_prob:0.5})#这里才开始真正进行训练计算
# 模型储存位置
saver.save(sess, ".\\MNIST_data\\model.ckpt")

#训练之后,使用测试集进行测试,输出最终结果
print("test_accuracy= %g"% accuracy.eval(feed_dict={x:mnist.test.images,y_:mnist.test.labels,keep_prob:1}))

以上程序用于导入MNIST数据集-创建模型-保存模型到指定路径。 
保存的路径会出现以下四个文件

各个文件的作用:

  • checkpoint: 文本文件,记录了模型文件的路径信息列表
  • model.ckpt.data-00000-of-00001: 网络权重信息
  • model.ckpt.index: .data和.index这两个文件是二进制文件,保存了模型中的变量参数(权重)信息
  • model.ckpt.meta: 二进制文件,保存了模型的计算图结构信息(模型的网络结构)protobuf

识别数字 

整体来看,和刚才的代码相似度很高,也是将需要测试的图片进行卷积,池化,softmax回归等等。 

from PIL import Image, ImageFilter
import tensorflow as tf
import matplotlib.pyplot as plt

def imageprepare():
    im = Image.open("MNIST_data\\test3.png") #读取的图片所在路径,注意是28*28像素
    plt.imshow(im)  #显示需要识别的图片
    plt.show()
    im = im.convert('L')
    tv = list(im.getdata())
    tva = [(255-x)*1.0/255.0 for x in tv]
    return tva

x = tf.placeholder(tf.float32, [None, 784])
y_ = tf.placeholder(tf.float32, [None, 10])

def weight_variable(shape):
    initial = tf.truncated_normal(shape,stddev = 0.1)
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1,shape = shape)
    return tf.Variable(initial)

def conv2d(x,W):
    return tf.nn.conv2d(x, W, strides = [1,1,1,1], padding = 'SAME')

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')

W_conv1 = weight_variable([3, 3, 1, 32])
b_conv1 = bias_variable([32])

x_image = tf.reshape(x,[-1,28,28,1])

h_conv1 = tf.nn.relu(conv2d(x_image,W_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1)

W_conv2 = weight_variable([3, 3, 32, 50])
b_conv2 = bias_variable([50])

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)

W_fc1 = weight_variable([7 * 7 * 50, 1024])
b_fc1 = bias_variable([1024])

h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*50])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

keep_prob = tf.placeholder("float")
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

W_fc2 = weight_variable([1024, 10])
b_fc2 = bias_variable([10])

y_conv=tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

cross_entropy = -tf.reduce_sum(y_*tf.log(y_conv))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

saver = tf.train.Saver()

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    saver.restore(sess, "MNIST_data\\model.ckpt") #使用模型,参数和之前的代码保持一致

    result = imageprepare()

    prediction=tf.argmax(y_conv,1)
    predint=prediction.eval(feed_dict={x: [result],keep_prob: 1.0}, session=sess)

    print('识别结果:')
    print(predint[0])

从测试结果来看,失败率还是挺高的。

问题总结 

制作图片

 图片大小必须是 28 x 28,可以选择ps或者美图秀秀或者其他任何的画图工具。

以下是博主通过美图秀秀制作的图片

 错误:

tensorflow.python.framework.errors_impl.InvalidArgumentError: Assign requires shapes of both tensors to match

 出现这个错误的原因是由于在训练模型做卷积和池化的时候,尺寸选择不一致造成的。

举例来说:

模型保存用的是

W_conv2 = weight_variable([3, 3, 32, 50])

但在识别的时候用的是

W_conv2 = weight_variable([5, 5, 32, 64])

务必保持相关参数一致

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow学习笔记(八)—— TensorFlow基于MNIST数据集识别手写数字 的相关文章

随机推荐

  • Pytest:fixture组件的简单使用方法

    fixture 可以构建测试准备阶段的步骤和数据 下面使用简单的案例演示 coding utf 8 Time 2021 10 2 13 49 Author PythonKimo File test 002 py import pytest
  • 如何在宽河道安装雷达流量计

    一 安装要求 设备安装方式采用野外一体化机架和不锈钢机箱方式 在机架直立杆腰部合适高度安装机箱 通讯天线等模块 机箱要求能可靠锁住 通讯模块天线等能合理 牢固地安装在机架上 太阳能板避免高大建筑物或树木遮挡 各安装点能在水平和垂直方向具备一
  • 嵌入式IDE(2):KEIL中SCF分散加载链接文件详解和实例分析

    在上一篇文章IAR中ICF链接文件详解和实例分析中 我通过I MX RT1170的SDK中的内存映射关系 分析了IAR中的ICF链接文件的语法 对于MCU编程所使用的IDE来说 IAR和Keil用得比较多 所以这一篇文章就来分析一下Keil
  • selenium自动化测试框架

    一 Selenium自动化测试 基于python 1 Selenium简介 1 1 Selenium是一款主要用于Web应用程序自动化测试的工具集合 Selenium测试直接运行在浏览器中 本质是通过驱动浏览器 模拟浏览器的操作 比如跳转
  • css常见问题1——解决css中数字和英文不换行的问题

    一 问题 1 问题描述 如果说文本是中文的话自动换行 不过当我们把文本换成数字或者字母就不会换行 2 问题展示 二 解决办法 1 原代码如下 ul li background color 4CB02A width 400px color f
  • Ubuntu下将python从2.7.12升级到3.5.2

    Python2 7版本升级到Python3 5 随着Python版本由2 x版本升级到3 x版本 原有的一些方法和模块在新的Python环境中已经不能使用 但是Ubuntu16 0中的Python版本依旧还是2 7版本 那么Ubuntu中P
  • Systemd中环境变量设置

    问题 不想把密码硬编码在代码里面 思路 让应用程序从环境变量中读取密码 SysV Service Environment MYSQL PASSWD sss 修改了Sys V的配置文件记得 要重新加载Sys V配置 sudo systemct
  • Altium Designer -- EMC/EMI电路设计经验

    一 基本概念 参看 电磁兼容原理及应用 讲的相当的不错 连接打不开 参看网盘 随着科学技术的不断发展 各种电气和电子设备已广泛应用于国民经济的各个部门以及人们的日常生活中 电气和电子设备在正常运行的同时 也往外发射有用或无用的电磁能量 这些
  • 【数据结构】二维数组的行优先、列优先存储问题

    今天同学问我一道感觉很基础的数据结构问题 虽然答案做对了 但是原理一直比较迷 仔细看了一下题 原来是自己把自己绕进去了 在此记录一下 大佬如果有更好的方法 可以在评论区留言 不定期更新 先给出行优先和列优先的计算公式 设数组为A m n m
  • 线程池学习笔记

    最大线程数只有在队列满了以后才开始工作 任务最大容量 最大数量 等待队列最大数量 超过则拒绝执行 会需要自己写拒绝策略 不然会抛出异常 如下图 如果将核心线程池数量设置成0 最大线程数量为int最大值 则适用场景为不可控的无法预估到底有多少
  • 2017-7-18 2-4 编写函数squeeze(s1,s2), 将字符串s1中任何与字符串s2中字符匹配的字符都删除。

    include
  • java虚拟机内存参数设置,reservedcodecachesize虚拟机jvm参数详解与调优说明

    一 reservedcodecachesize参数介绍 该参数是JvM虚拟机调优中调整内存大小的一个设置参数 值得大小设置直接影响到Code Cache的大小 而jvm编译的代码有常常存放在Code Cache中 而Code Cache的空
  • vue+ElementUI el-table表格再次封装集成多级表头合并单元格(表头分组、多级表头合并)及render渲染列

    1 此功能已集成到TTable组件中 2 实现思路 使用递归组件 源码
  • C++STL之各种容器的使用场景

    1 总结相关容器的使用场景 1 vector的使用场景 只查看 而不频繁插入删除的 因为频繁插入删除会造成内存的不断搬家和删除 使用场景比如软件历史操作记录的存储 我们经常要查看历史记录 比如上一次的记录 上上次的记录 但却不会去删除记录
  • OpenWRT 程序开机启动

    原理 bin sh etc rc common指定了执行该脚本的方式 必须 START 95 代表该脚本的启动顺序为95 注意 不是第95个执行的脚本 而是一个级别 数字越小 启动的越早 start 启动服务 stop 停止服务 resta
  • keil5 Debug调试报错“No CPU DLL specified under “Options for Target - Debug‘!”

    正常测试某个读写测试示例 结果Debug出弹窗如下图 最后解决方式如下 点击 魔术棒 Debug 在Driver DLL中填入 SARMCM3 DLL 点击ok 再次进行调试 问题解决
  • mysql(六)多列索引之索引顺序问题

    使用索引常见的错误是 为每列创建单独的索引 或者按照错误的顺序创建多列索引 多列索引 多列索引 是指在创建索引时所关联的字段不是一个字段 而是多个字段 虽然可以通过所关联的字段进行查询 但是只有查询条件中使用了所关联字段中的第一个字段 多列
  • uvm之寄存器模型

    寄存器模型的意义 寄存器模型的搭建 寄存器模型的FAQ 寄存器模型的意义 寄存器模型 字面理解 跟参考模型类似 就是为工程里的寄存器提供一个参考模型 这个模型里 包括各个寄存器字段描述 寄存器 寄存器组 寄存器地址映射等信息 有如下好处 寄
  • 【python小游戏毕设】吃豆人小游戏设计与实现

    文章目录 0 前言 1 课题背景 2 实现效果 3 Pygame介绍 4 原理和实现 4 1 环境配置 4 3 创建游戏类 4 3 游戏地图 4 4 游戏主循环 5 最后 0 前言 这两年开始毕业设计和毕业答辩的要求和难度不断提升 传统的毕
  • TensorFlow学习笔记(八)—— TensorFlow基于MNIST数据集识别手写数字

    训练程序 参照Tensorflow中文社区教程 http www tensorfly cn tfdoc tutorials mnist pros html 能在自己的环境中成功运行代码 注意一点 关于教程的print函数 在博主用的Pyth