TensorFlow之双隐含层多层感知器（MLP）

2023-11-13

程序改自上一篇博客，使用了双隐含层，第二层隐含层初始w需要和第一层类似，否则程序正确率一直在0.1左右。修改后的程序正确率也在98%左右。

# -*- coding:utf-8 -*-
from tensorflow.examples.tutorials.mnist import input_data
import tensorflow as tf

# data
dir='/home/kaka/Documents/input_data'
mnist = input_data.read_data_sets(dir, one_hot=True)

# model
sess = tf.InteractiveSession()

hd1in_units = 784
hd1out_units = 500
hd2out_units = 300

w1 = tf.Variable(tf.truncated_normal([hd1in_units, hd1out_units], stddev=0.1))
b1 = tf.Variable(tf.zeros(hd1out_units))
# w2 = tf.Variable(tf.zeros([hd1out_units, hd2out_units]))
w2 = tf.Variable(tf.truncated_normal([hd1out_units, hd2out_units], stddev=0.1))
b2 = tf.Variable(tf.zeros([hd2out_units]))
w3 = tf.Variable(tf.zeros([hd2out_units, 10]))
b3 = tf.Variable(tf.zeros([10]))


x = tf.placeholder(tf.float32, [None, hd1in_units])

keep_prob = tf.placeholder(tf.float32)   # dropout proportion
hidden1 = tf.nn.relu(tf.matmul(x, w1) + b1)
hidden1_drop = tf.nn.dropout(hidden1, keep_prob)

hidden2 = tf.nn.relu(tf.matmul(hidden1_drop, w2) + b2)
hidden2_drop = tf.nn.dropout(hidden2, keep_prob)

y = tf.nn.softmax(tf.matmul(hidden2_drop, w3) + b3)

# loss
y_ = tf.placeholder(tf.float32, [None, 10])
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y))

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

train_step = tf.train.AdagradOptimizer(0.3).minimize(cross_entropy)
# train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

tf.global_variables_initializer().run()
for i in range(100000):
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys, keep_prob: 0.8})
    if i % 100 == 0:
        train_accuracy = accuracy.eval(feed_dict={
            x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0})
        print('step %d, training accuracy %g' % (i, train_accuracy))

print(sess.run(accuracy, feed_dict={x: mnist.test.images,
                                    y_: mnist.test.labels,
                                    keep_prob: 1.0}))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

tensorflow

多层感知器

mlp

双隐含层

TensorFlow之双隐含层多层感知器（MLP）的相关文章

当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
在 keras 中使用自定义张量流操作

我在张量流中有一个脚本其中包含自定义张量流操作我想将代码移植到 keras 但我不确定如何在 keras 代码中调用自定义操作我想在 keras 中使用tensorflow 所以到目前为止我发现的教程描述了与我想要的相反的内容 htt
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
Tensorflow `tf.layers.batch_normalization` 不会向 `tf.GraphKeys.UPDATE_OPS` 添加更新操作

以下代码复制粘贴可运行说明了如何使用tf layers batch normalization import tensorflow as tf bn tf layers batch normalization tf constant
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
TensorFlow 无法编译

尝试从源代码编译 TensorFlow 时出现以下错误任何想法都会有帮助 bazel out host bin solib local U S Stensorflow Spython Cgen Unn Uops Upy Uwrappers
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con

随机推荐

3D模型地球
Kubernetes 灰度/滚动发布滚动更新速率控制解读 maxUnavailable，maxSurge

利用kubernetes的滚动更新时可能经常遇到发布太快不稳定或太慢体验差的情况本文将介绍kubernetes滚动更新控制速率的特性金丝雀发布金丝雀发布这个术语源自20世纪初期当时英国的煤矿工人在下井采矿之前会把笼养的金
Postman(2)：form-data、x-www-form-urlencoded、raw、binary的区别

postman中 form data x www form urlencoded raw binary的区别 QQ 851228082的博客 CSDN博客 www form urlencoded RequestBody的使用 justry
Angular: @NgModule

第一部分概览 declarations 属于这个模块的 component pipe directive 的列表 providers Provider 这个 imports Array
idea里面Mybatis的xml基础配置文件表名、字段、别名报红问题的解决！

这里是因为我之前在idea里面设置了Hibernate的MySQL方言导致Mybatis的xml基础配置文件表名字段别名疯狂报红 1 最终取消了idea里面MySql的方言设置之后问题及解决了 idea操作步骤 file gt se
鸿蒙关于读取手机文件操作

1 申请读写权限先在config json中申请再使用JAVA代码动态申请 ohos permission READ USER STORAGE和ohos permission WRITE USER STORAGE 2 获取File对象
html页面回退刷新,vue2.0页面前进刷新回退不刷新的实现方法

这篇文章主要为大家详细介绍了vue2 0页面前进刷新回退不刷新的实现方法具有一定的参考价值可以用来参考一下感兴趣的小伙伴下面一起跟随512笔记的小编两巴掌来看看吧花了整整一周时间尝试过很多种方法终于找到了最佳的解决方案对我来
使用分支——Git Checkout

这篇文章写的挺好 https zhuanlan zhihu com p 465954849 这里要注意 git 新的命令通过 git switch 切换分支虽然git checkout 分支还可以用游离状态的HEADS 在我们已经见
pikachu靶场搭建以及搭建问题

前言 pikachu是一个适合Web渗透测试学习的小白们进行训练的本地靶场并且已经在github上开源了它是一个综合性的靶场非常适合新手练习接下来就简单的看一下它如何在Windows上搭建吧 Apache与MySQL环境搭建然后这
如何判断合法标识符

题目描述给出一个标识符请你判断它是否是C语言合法的标识符输入输入一个标识符长度不超过100 输出判断是否合法如果是输出YES 否则输出NO 示例输入 123You 示例输出 NO 提示 C语言规定标识符只能由字母数字和下划
SSH 和 SSL 加密协议

SSH和SSL都是加密协议用于保护网络通信的安全性和完整性但它们用途和实现方式有所不同 SSH Secure Shell 是一种网络协议用于远程访问和管理服务器它提供了加密的连接和认证机制使得数据传输更加安全 SSH通常用于远程登
Linux下使用STM32CUBEMX的makefile，报multiple defination错误的解决办法

之所以报这个错是因为stm32cubemx生成makefile的一个bug 在C SOURCES部分会重复添加Src 下的c文件上图是没有修改makefile之前下图为修改后要修改的部分
pthon代码实现在linux下对siebel服务器换包重启

siebel服务器的换包重启需要输入多个命令而且中间需要等待经常停了服务忘了启动之前项目的TA有写过一些shell脚本启服务的停服务的包括自动换包重启的但是因为里面有个mount目录经常出问题所以平时也没有使用最近刚好在
css基本语法

1 background background image url image jpg background color ccf background position center background repeat no repeat
数据库：什么是主键

数据库主键主键表中经常有一个列或列的组合其值能唯一地标识表中的每一行通俗叫一个表中只能有一个主键不接受空值能唯一的表示表中的每一行例如银行卡的卡号就是主键不存在重复的情况
Java 数据类型转换(Casting)

Java中经常可以遇到类型转换的场景从变量的定义到复制数值变量的计算到方法的参数传递基类与派生类间的造型等随处可见类型转换的身影 Java中的类型转换在Java编码中具有重要的作用本文主要介绍一下Java 数据类型转换 Cast
华为防火墙默认密码是什么？

华为默认密码是什么分享至小王邀请您加入牛B的IT关键业务推动者社区点击领取12G的软考 PMP资料包特训营名额 gt gt 售前工程师系列教你写解决方案 gt gt ld11235813 荣誉会员 Rank 12Rank 12Ra
华为动态pnat配置
微软宣布IE9正式版发布日期

微软上月曾透露会在3月14日于美国德克萨斯州奥斯汀市SXSW音乐电影节上举办一个庆祝派对从那时起就有很多猜想我们才曾猜测微软届时会正式发布IE9 今天微软终于不再卖关子 3月14日也就是下周一微软将正式发布IE9 微软证实美国太
TensorFlow之双隐含层多层感知器（MLP）

程序改自上一篇博客使用了双隐含层第二层隐含层初始w需要和第一层类似否则程序正确率一直在0 1左右修改后的程序正确率也在98 左右 coding utf 8 from tensorflow examples tutorials mni

TensorFlow之双隐含层多层感知器（MLP）

TensorFlow之双隐含层多层感知器（MLP） 的相关文章

随机推荐

热门标签

TensorFlow之双隐含层多层感知器（MLP）的相关文章