LeNet-5模型代码（在mnist_train.py上修改）

2023-11-15

首先是mnist_train.py的修改如下：

import os
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import  input_data
import numpy as np

# 加载mnist_inference.py中定义的常量和前向传播的函数
import mnist_inference

# 配置神经网络的参数
BATCH_SIZE = 100
LEARNING_RATE_BASE = 0.8
LEARNING_RATE_DECAY = 0.99
REGULARAZTION_RATE = 0.0001
TRAINING_STEPS = 30000
MOVING_AVERAGE_DECAY = 0.99
# 模型保存的路径和文件名
MODEL_SAVE_PATH = "/path/to/model/"
MODEL_NAME= "model.ckpt"

def train(mnist):
    # 定义输入输出placehoder.
    x = tf.placeholder(
        tf.float32, [BATCH_SIZE,mnist_inference.IMAGE_SIZE,
                     mnist_inference.IMAGE_SIZE,
                     mnist_inference.NUM_CHANNELS],name='x-input'
    )
    y_ = tf.placeholder(
        tf.float32,[None,mnist_inference.OUTPUT_NODE],name='y-input'
    )
    regularizer = tf.contrib.layers.l2_regularizer(REGULARAZTION_RATE)
    # 直接使用mnist_inference.py中定义的前向传播过程
    y = mnist_inference.inference(x, train, regularizer)
    global_step = tf.Variable(0,trainable=False)
    variable_averages = tf.train.ExponentialMovingAverage(
        MOVING_AVERAGE_DECAY, global_step
    )
    variable_averages_op = variable_averages.apply(
        tf.trainable_variables()
    )
    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(
        logits=y, labels=tf.argmax(y_, 1)
    )
    cross_entropy_mean = tf.reduce_mean(cross_entropy)
    loss=cross_entropy_mean + tf.add_n(tf.get_collection('losses'))
    learning_rate = tf.train.exponential_decay(
        LEARNING_RATE_BASE,
        global_step,
        mnist.train.num_examples / BATCH_SIZE,
        LEARNING_RATE_DECAY
    )
    train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss,global_step=global_step)
    with tf.control_dependencies([train_step,variable_averages_op]):
        train_op = tf.no_op(name='train')
    saver = tf.train.Saver()
    with tf.Session() as sess:
        tf.global_variables_initializer().run()
        # 在训练过程中不再测试模型在验证集上的表现，验证集和测试的过程将会有一个独立的程序来完成。
        for i in range(TRAINING_STEPS):
            xs, ys = mnist.train.next_batch(BATCH_SIZE)
            reshaped_xs = np.reshape(xs, (BATCH_SIZE,
                                          mnist_inference.IMAGE_SIZE,
                                          mnist_inference.IMAGE_SIZE,
                                          mnist_inference.NUM_CHANNELS))
            _, loss_value, step = sess.run([train_op, loss, global_step], feed_dict={x: reshaped_xs, y_: ys})
            if i % 1000 == 0:
                print("After %d training step(s), loss on training batch is %g." % (step, loss_value))
                saver.save(sess, os.path.join(MODEL_SAVE_PATH, MODEL_NAME), global_step=global_step)
def main(argv = None):
    mnist = input_data.read_data_sets("/path/to/mnist_data",one_hot=True)
    train(mnist)
if __name__ == '__main__':
    tf.app.run()

然后是mnis_inference.py的修改，代码如下：

import tensorflow as tf

#定义网络结构，输入、输出和隐藏层的节点数
#28*28，相当于图片的像素
INPUT_NODE = 784
#输出分类的个数
OUTPUT_NODE = 10
#图片的像素大小
IMAGE_SIZE = 28
#输入图片的深度
NUM_CHANNELS = 1
#输出结果的分类数
NUM_LABELS = 10

#第一层卷积层的尺寸和深度
CONV1_DEEP = 32
CONV1_SIZE = 5

#第二层卷积层的尺寸和深度
CONV2_DEEP = 64
CONV2_SIZE = 5

#全连接层节点个数
FC_SIZE = 512

#重置default graph计算图以及nodes节点
tf.reset_default_graph()
#定义神经网络的前向传播过程，定义了一个新参数train，用于区分训练过程和测试过程。在这个程序中将用到
#dropout方法，用来进一步提升模型的可靠性并防止过拟合，dropout过程只在训练时使用。
def inference(input_tensor,train,regularizer):
    #声明第一层神经网络的变量并完成前向传播过程。tf.variable_scope生成了一个上下文管理器，来管理已经创建的变量。
    #使用不同的命名变量来隔离不同层的变量，可以让每一层中的变量命名只需要考虑在当前层的作用，而不需要担心重名
    #的问题。这里定义的卷积层输入为28*28*1，因为使用了全0填充，所以输出为28*28*32的矩阵。
    with tf.variable_scope('layer1-conv1'):
        #这里通过tf.get_variable和tf.Variable没有本质区别，因为在训练或是测试中没有在同一个程序中多次调用这个
        #函数。如果在同一个程序中多次调用，第一次调用后要将reuse设置为True。
        #声明了输入到隐藏层的权重变量和偏执项
        conv1_weights = tf.get_variable('weight',[CONV1_SIZE,CONV1_SIZE,NUM_CHANNELS,CONV1_DEEP],
                                        initializer=tf.truncated_normal_initializer(stddev=0.1))
        conv1_biases = tf.get_variable('bias',[CONV1_DEEP],initializer=tf.constant_initializer(0.0))
        #使用边长为5，深度为32的过滤器，过滤器移动的步长为1，且使用全0填充。全0填充可以使卷积层
        #前向传播结果矩阵的大小和当前层一致。
        conv1 = tf.nn.conv2d(input_tensor,conv1_weights,strides=[1,1,1,1],padding='SAME')

        relu1 = tf.nn.relu(tf.nn.bias_add(conv1,conv1_biases))

    #实现第二层池化层的前向传播过程，选用最大池化层，过滤器边长为2，使用全0填充且移动步长
    #为2.这一层的输入是上一层的输出，即输入为28*28*32,输出为14*14*32的矩阵。
    with tf.name_scope('layer2-pool1'):
        #第一个参数为当前层的节点矩阵，这是一个四维矩阵。ksize提供了过滤器的尺寸，四维数组的第一个和最后一个数必须为1
        #，这意味着池化层过滤器是不可以跨不同输入样例或者节点矩阵深度的。strides提供了步长信息，第一维和
        #最后一维也只能是1，表明池化层不能减少节点矩阵深度或输入样例个数。padding是否全0填充。
        pool1 = tf.nn.max_pool(relu1,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

    #声明第三层卷积层的变量并实现前向传播过程。这一层输入为14*14*32的矩阵，输出为14*14*64的矩阵。
    with tf.variable_scope('layer3-conv2'):
        #这里通过tf.get_variable和tf.Variable没有本质区别，因为在训练或是测试中没有在同一个程序中多次调用这个
        #函数。如果在同一个程序中多次调用，第一次调用后要将reuse设置为True。
        #声明了输入到隐藏层的权重变量和偏执项
        conv2_weights = tf.get_variable('weight',[CONV2_SIZE,CONV2_SIZE,CONV1_DEEP,CONV2_DEEP],
                                        initializer=tf.truncated_normal_initializer(stddev=0.1))
        conv2_biases = tf.get_variable('bias',[CONV2_DEEP],initializer=tf.constant_initializer(0.0))
        #使用边长为5，深度为64的过滤器，过滤器移动的步长为1，且使用全0填充。
        conv2 = tf.nn.conv2d(pool1,conv2_weights,strides=[1,1,1,1],padding='SAME')

        relu2 = tf.nn.relu(tf.nn.bias_add(conv2,conv2_biases))
    #实现第四层池化层的前向传播过程，和第二层的结构一样，输入为14*14*64的矩阵，输出为7*7*64的矩阵。
    with tf.name_scope('layer4-pool2'):

        pool2 = tf.nn.max_pool(relu2,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

    #将第四层池化层的输出转化为第五层全连接层的输入。第四层输出为7*7*64的矩阵，然而全连接层
    #需要输入的格式为向量，所以在这里需要将这个7*7*64的矩阵拉直成一个向量。pool2.get_shape()
    #函数可以得到第四层输出矩阵的维度而不需要手工计算。注意每一层神经网络的输入输出都为一个
    #batch的矩阵，所以这里得到的维度也包含了一个batch中的数据个数。
    pool_shape = pool2.get_shape().as_list()
#    print(pool_shape) 结果为[100,7,7,64]
    #计算矩阵拉直成向量后的长度，是矩阵长宽及深度的乘积，pool_shape[0]是一个batch中的数据个数。
    nodes = pool_shape[1]*pool_shape[2]*pool_shape[3]
#    print(pool_shape[1],pool_shape[2],pool_shape[3],pool_shape[0])
    #通过tf.reshape函数将第四层得输出变为一个batch的向量。
    reshaped = tf.reshape(pool2,[pool_shape[0],nodes])
#    print(reshaped)

    #声明第五层的变量并实现前向传播过程。这一层的输入为拉直后的一组向量。长度为7*7*64，输出
    #的长度为512的向量。这一层引入了dropout的概念，训练时会随机将部分节点输出改为0，，避免
    #过拟合，从而使模型在测试数据上的表现更好，一般只用在全连接层。
    with tf.variable_scope('layer5-fc1'):
        fc1_weights = tf.get_variable("weight",[nodes,FC_SIZE],
                                      initializer=tf.truncated_normal_initializer(stddev=0.1))
        #只有全连接层的权重需要加入正则化
        if regularizer != None:
            tf.add_to_collection('losses',regularizer(fc1_weights))

        fc1_biases = tf.get_variable('bias',[FC_SIZE],initializer=tf.constant_initializer(0.1))

        fc1 = tf.nn.relu(tf.matmul(reshaped,fc1_weights)+fc1_biases)
        if train:fc1 = tf.nn.dropout(fc1,0.5)

    #声明第六层全连接层的变量并实现前向传播，这一层的输入为长度为512的向量，输出为一组长度
    #为10的向量，这一层的输出通过softmax之后就得到了最后的分类结果。
    with tf.variable_scope('layer6-fc2'):
        fc2_weights = tf.get_variable("weight",[FC_SIZE,NUM_LABELS],
                                      initializer=tf.truncated_normal_initializer(stddev=0.1))

        if regularizer != None:
            tf.add_to_collection('losses',regularizer(fc2_weights))

        fc2_biases = tf.get_variable('bias',[NUM_LABELS],initializer=tf.constant_initializer(0.1))

        logit = tf.matmul(fc1,fc2_weights) + fc2_biases
    #返回第六层的输出。
    return logit

后续补充详细过程。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络

深度学习

tensorflow

LetNet5模型

卷积

LeNet-5模型代码（在mnist_train.py上修改）的相关文章

Tensorflow：docker 镜像和 -gpu 后缀

在具有 GPU 支持的 Tensorflow 的 Docker 映像中例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
使用 Keras 的 ImageDataGenerator 预测单个图像

我对深度学习很陌生所以请原谅我这个可能很简单的问题我训练了一个网络来分类positive and negative 为了简化图像生成和拟合过程我使用了ImageDataGenerator和fit generator函数如下图 imp
如何在 Windows 上的 Python 2.7 上安装 Tensorflow？

我尝试通过 pip 安装 TensorFlow pip install tensorflow 但是得到这个错误找不到满足tensorflow要求的版本来自版本这个问题有解决办法吗我还是想通过pip安装如果您只因为 Keras 而需
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
带有 s3 路径的张量板 logdir

我看到tensorflow支持AWS s3文件系统 https github com tensorflow tensorflow tree master tensorflow core platform s3 https github co
使用 TensorFlow 2.1 的 Cloud TPU v3 Pod 的 TPUClusterResolver 出现错误

我正在尝试在带有 TensorFlow 2 1 的 Google Cloud Compute Engine VM 上使用我的抢占式 Cloud TPU v3 256 但它似乎无法正常工作TPUClusterResolver抛出一个Coul
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
在 keras 中集成采样的 softmax 失败

基于如何在 Keras 模型中使用 TensorFlow 的采样 softmax 损失函数 https stackoverflow com questions 47892380 how can i use tensorflows sampl
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
TensorFlow 相当于 PyTorch 的 Transforms.Normalize()

我正在尝试推断最初在 PyTorch 中构建的 TFLite 模型我一直在遵循PyTorch 实现 https github com leoxiaobin deep high resolution net pytorch blob 1ee
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
ValueError：没有为“dense_input”提供数据

我正在使用以下简单的代码使用tensorflow加载csv并使用keras执行建模无法弄清楚这个错误 import tensorflow as tf train dataset fp tf keras utils get file fna
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
张量流中的复杂卷积

我正在尝试运行一个简单的卷积但包含复数 r np random random 1 10 10 10 i np random random 1 10 10 10 x tf complex r i conv layer tf layers c

随机推荐

天地图WMTS地图瓦片下载

最近在开发个人项目中遇到了这样一个问题即本地开发使用天地图在线地图服务部署到线上时突然想到天地图提供的开放地图服务是需要申请秘钥key才能够使用的而且需要连接外网同时也是有访问次数限制的那么如果是在内网环境中如何进行迁移呢
[AWS] 利用serverless将WebSockets与AWS API Gateway和Lambda一起使用来构建实时应用程序

1 WebSocket API 概念 WebSocket API由一个或多个路由组成路由选择表达式用于确定特定请求应使用的路由该选择将在请求中提供根据请求对表达式进行求值以产生与您的路线的routeKey值之一相对应的值例如如果
jsp页面设置UTF-8

在我们安装好Eclipse中新建jsp页面的时候我们总是会需要编码格式现在我来介绍一个方式使我们新建的jsp默认是UTF 8 1 首先我们需要在window gt preterences 2 选择我们的web选项中的jsp Files
antd+umi 嵌套路由_layout.js及antd tabs menus共同使用，实现点击菜单打开一个tabs页面并跳转路由，需要keep-alive实现数据缓存

把左侧菜单放一个容器component里面把menu里面的相关API内容 activeKey openKeys 这个我没放根据当前路径去对比数据找到当前展开的menu 当前的menu的url key name 因为tabs需要用到都记
ug如何导入excel数据点_UG NX二次开发读取EXCEL表格方法二

之前写过一篇文章是关于NX二次开发读excel表格文件的今天再来写另一个方法这个方法其实与二次开的关系不是很大如果要用在二次开中应该也是可以的先大概说一下思路 NX的表达式不知道大家用的多不多如果大家对这个东西熟悉的话今天的这个
react的路由配置

1 安装依赖 npm install react router dom save dev 2 src router index js Root Router 配置 import React from react import Route S
基于Java+SSM项目的计算机毕业设计-快递管理系统(附论文+源码)

大家好我是职场程序猿感谢您阅读本文欢迎一键三连哦当前专栏 Java毕业设计精彩专栏推荐安卓app毕业设计微信小程序毕业设计演示视频 ssm001快递管理系统演示转标准源码下载地址 https download csdn
[4G/5G/6G专题基础-157]: 无线数据承载DRB与无线信令承载SRB

目录第1章无线承载概述 1 1 协议栈 LTE为例 1 2 什么是无线承载Radio Bear 1 3 LTE的无线承载 1 4 5G的无线承载Qos flow 1 5 4G与5G的区别第2章无线承载的类型 2 1 根据级别分 LT
数学建模（生物数学篇）之 MATLAB绘制解曲线的应用实例（2/3）

一实验目的理解并掌握利用MATLAB绘制生物数学相关方程中的解曲线二实验内容例著名的Lorenz模型的状态方程表示如下其中设若令其初值为为机器上可以识别的小常数如选取一个很小的正数试画图求解练习选做两个 1 极限
阿里云大数据实战记录8：拆开 json 的每一个元素，一行一个

目录一前言二目标介绍三使用 pgsql 实现 3 1 拆分 content 字段 3 2 拆分 level 字段 3 3 拼接两个拆分结果四使用 ODPS SQL 实现 4 1 拆分 content 字段 4 2 拆分 le
【计算机毕设选题】2024年计算机类最新毕设选题推荐

各位学弟学妹们你们好这里是零点毕设关于计算机类最新毕设选题方面的文章对毕设选题上有任何疑问都可以文末小卡片联系零点毕设大四是整个大学期间最忙碌且是最重要的一段时光有些童鞋一边要忙着准备考研考公或者就是为毕业实习找工作而准备一
裴蜀（贝祖）等式介绍

欧几里得算法即辗转相除法在这里不再过多描述该算法高中的时候学过的在这里直接附代码 public static int gcd int m int n return n 0 m gcd n m n 贝祖等式简单描述 ax by m
Explain详解与索引优化实践

一准备工作建立三张表并插入数据 DROP TABLE IF EXISTS actor CREATE TABLE actor id int 11 NOT NULL name varchar 45 DEFAULT NULL update
【机器学习】支持向量机（5）——SMO算法

前言通过前几篇博客的介绍相信大家已经对支持向量机有了一定的了解我们知道支持向量机的学习问题可以形式化为求解凸二次规划问题 min 1 2
UNIX网络编程卷一学习笔记第十三章守护进程和inetd超级服务器

守护进程是在后台运行且不与任何控制终端关联的进程 Unix系统通常有很多守护进程在后台运行约20到50个的量级执行不同的管理任务守护进程通常由系统初始化脚本在开机时运行启动而没有控制终端是在系统初始化脚本中启动进程的副作用但守
【2023最全教程】Web自动化测试怎么做？Web自动化测试的详细流程和步骤

一什么是web自动化测试自动化 Automation 是指机器设备系统或过程生产管理过程在没有人或较少人的直接参与下按照人的要求经过自动检测信息处理分析判断操纵控制实现预期的目标的过程这是教科书里面的自动化的定义
去掉li前面的圆点

在HTML中使用无序列表ul li的时候通常前面会出现一个圆点那么如何把这个圆点去掉呢在 li 里使用 list style none 案列演示没有使用list style none 使用list style none 示例代码 ul
pytorch的gpu版本安装以及cpu版本的卸载

目录前言一安装显卡驱动二安装Visual Studio 2019 三安装CUDA 四安装cudnn 五安装anaconda 六安装PyTorch 前言因为最近需要导师的指导我开始了unet的学习虽然之前也学习过机器学
Android 避免耗时操作及解决办法

Android耗时操作我们可以通过几种方式实现 IntentService IntentService 与Service的不同之处在于IntentService是可以执行耗时任务的而Service不能够执行耗时任务否则会出现ANR异常
LeNet-5模型代码（在mnist_train.py上修改）

首先是mnist train py的修改如下 import os import tensorflow as tf from tensorflow examples tutorials mnist import input data impo

LeNet-5模型代码（在mnist_train.py上修改）

LeNet-5模型代码（在mnist_train.py上修改） 的相关文章

随机推荐

热门标签

LeNet-5模型代码（在mnist_train.py上修改）的相关文章