Tensorflow：BP神经网络权值初始化

2023-11-03

一、Tensorflow入门

1、计算图：

每一个计算都是计算图上的一个结点，而节点之间的边描述了计算之间的依赖关系。
支持通过tf.Graph生成新的计算图，不同计算图上的张量和运算不会共享。
Tensorflow会自动生成一个默认的计算图，如果没有特殊指定，运算会自动加入这个计算图中。

import tensorflow as tf

def BP_NeuralNetwork():
    g = tf.Graph()
    with g1.as_default():
        v = tf.get_variable("v", shape=[1], initializer=tf.zeros_initializer)
    with tf.Session(graph=g1) as sess:
        print(sess.run(v))

2、张量：张量中保存了三个属性：名字、维度和类型。其中名字，不仅是唯一标识符，还显示了该张量是如何被计算出来的（某个结点/计算的第几个输出）；关于类型，需要注意的是，如果不指定，tensorflow会给出默认类型。

3、会话：拥有并管理Tensorflow程序运行时的所有资源。

创建会话

with tf.Session() as sess:
    sess.run()

自动将生成的会话注册为默认会话

sess = tf.InteractiveSession()
print(result.eval())

二、实现的简单BP神经网络

数据来源是Kaggle中的mushroom数据集，是一个有22个特征的二分类问题，这里是将22个特征拆为了117个特征输入。实现的过程比较简单，主要是参考了kaggle中的一个kernal和《TensorFlow实战Google深度学习框架》。刚开始使用了6层隐藏层，后来减为1层隐藏层后效果也很不错（测试集正确率100%）。

import tensorflow as tf
import numpy as np
import pandas as pd

def get_wight(shape, lambdal):
    # np.random.randn 标准正态分布 期望为 0 方差为 1
    # random initialization
    var = tf.Variable(tf.random_normal(shape, mean=0, stddev=0.1),dtype=tf.float32)
    # Xavier initialization
    # var = tf.Variable(np.random.randn(shape[0], shape[1]), dtype=tf.float32) / np.sqrt(shape[0])
    # He initialization
    # var = tf.Variable(np.random.randn(shape[0], shape[1]), dtype=tf.float32) / np.sqrt(shape[0] / 2)
    # var = tf.Variable(tf.truncated_normal(shape, stddev=2./np.math.sqrt(shape[0])),dtype=tf.float32)
    tf.add_to_collection('losses',tf.contrib.layers.l2_regularizer(lambdal)(var))
    return var

data = pd.read_csv('input/Result.csv')

train = data.iloc[:8000,:]
test = data.iloc[8000:,:]

x = tf.placeholder("float",[None, 117])
y_ = tf.placeholder("float", [None, 2])

#每层节点的个数
laryer_dimension = [117, 128, 2]
n_layers = len(laryer_dimension)

cur_layer = x
in_dimension = laryer_dimension[0]

#生成网络结构
for i in range(1, n_layers):
    out_dimension = laryer_dimension[i]
    weight = get_wight([in_dimension,out_dimension], 0.001)
    bias = tf.Variable(tf.constant(0.1, shape = [out_dimension]))
    if i < n_layers-1:
        cur_layer = tf.nn.relu(tf.matmul(cur_layer, weight) + bias)
    else:
        cur_layer = tf.nn.softmax(tf.matmul(cur_layer, weight) + bias)
    in_dimension = laryer_dimension[i]

y = cur_layer

#损失函数
# mse_loss = tf.losses.mean_squared_error(y_, y)
cross_entropy = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=y_, logits=y))
tf.add_to_collection('losses', cross_entropy)
loss = tf.add_n(tf.get_collection('losses'))

correct_prediction = tf.equal(tf.argmax(y_,1), tf.argmax(y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

train_op = tf.train.AdamOptimizer(0.003).minimize(loss)
TRAINING_STEPS = 101

fig_loss = np.zeros([TRAINING_STEPS])
fig_accuracy = np.zeros([TRAINING_STEPS])

with tf.Session() as sess:
    saver = tf.train.Saver()
    tf.global_variables_initializer().run()
    for i in range(TRAINING_STEPS):
        train_data = train.sample(1000)
        train_features = train_data.iloc[:,2:].values
        train_target = train_data.iloc[:,0:2].values
        sess.run(train_op, feed_dict={x:train_features,y_:train_target})
        fig_loss[i] = sess.run(loss, feed_dict={x:train_features,y_:train_target})
        fig_accuracy[i] = sess.run(accuracy, feed_dict={x:train_features,y_:train_target})
    test_data = test.sample(122)
    test_features = test_data.iloc[:,2:].values
    test_target = test_data.iloc[:,0:2].values
    test_acc = sess.run(accuracy, feed_dict={x:test_features, y_:test_target})
    print("test_acc: " , test_acc)
    save_path = saver.save(sess, "./model.ckpt")

np.save('output/RNIn_001_loss.npy',fig_loss)
np.save('output/RNIn_001_acc.npy',fig_accuracy)

三、BP神经网络初始化

深度学习中的权值初始化对模型收敛速度和模型质量有重要影响，在隐藏层的连接中，我们通常使用ReLU，相对应的权重初始化有Xavier Initialization和变种He Initialization。

这里我对权值初始化进行了一些测试，首先是随机初始化，效果非常差，其他是基于正态分布做的。

1、使用正态分布初始化，这里我均值都设为0，方差由0.1到1测试时发现，方差越小（不能为0）损失减少越快，正确率提高越快。

var = tf.Variable(tf.random_normal(shape, mean=0, stddev=0.1),dtype=tf.float32)

2、Xavier Initialization

var = tf.Variable(np.random.randn(shape[0], shape[1]), dtype=tf.float32) / np.sqrt(shape[0])

#截断正态分布随机数
var = tf.Variable(tf.truncated_normal(shape, stddev=2./np.math.sqrt(shape[0])),dtype=tf.float32)

3、He Initialization

var = tf.Variable(np.random.randn(shape[0], shape[1]), dtype=tf.float32) / np.sqrt(shape[0] / 2)

四、在使用tensorflow编写BP网络中遇到的问题及解决

1、训练的LOSS一直为0

对于二分类问题，最后的Loss不能用tf.nn.softmax_cross_entropy_with_logits来计算，而应该用tf.nn.sigmoid_cross_entropy_with_logits。因为计算softmax，对于二分类问题其值永远为1，然后在计算交叉熵时，就导致cost永远为0。

2、二分类问题计算正确率：输出结点需设置为两个，否则argmax()无法使用

correct_prediction = tf.equal(tf.argmax(y_,1), tf.argmax(y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

参考资料：

权值初始化：https://zhuanlan.zhihu.com/p/25110150

Loss为零：https://blog.csdn.net/qq_34661230/article/details/88313252

正则化：https://github.com/caicloud/tensorflow-tutorial/blob/master/Deep_Learning_with_TensorFlow/1.4.0/Chapter04/3.%20%E6%AD%A3%E5%88%99%E5%8C%96.ipynb

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

BP神经网络初始化

Tensorflow：BP神经网络权值初始化的相关文章

在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
Tensorflow-GPU安装导入错误：DLL加载失败：找不到指定的模块

好吧我知道这可能已经回答了问题但我已经尝试了 stackoverflow 上建议的几乎所有技巧来安装 tensorflow gpu 并在官方文档上建议但没有运气我遇到了同样的错误首先我尝试过this https towardsda
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
MultiHeadAttention Attention_mask [Keras、Tensorflow] 示例

我正在努力掩盖 MultiHeadAttention 层的输入我正在使用 Keras 文档中的 Transformer Block 进行自我关注到目前为止我在网上找不到任何示例代码如果有人能给我一个代码片段我将不胜感激变压器块来
在按顺序读取的多个特征文件上训练 Keras 模型以节省内存

当我尝试读取大量功能文件时我遇到了内存问题见下文我想我应该分割训练文件并按顺序读取它们做到这一点的最佳方法是什么 x train np load path features x train npy y train np load p
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten
具有不同尺寸图像的 Tensorflow 输入数据集

我正在尝试使用不同大小的输入图像来训练完全卷积神经网络我可以通过循环训练图像并在每次迭代时创建单个 numpy 输入来做到这一点即 for image input label in zip image data labels train
在 Tensorflow 中使用迁移学习是否需要预定义图像大小？

我打算使用预先训练的模型例如fast rcnn resnet101 pets用于 Tensorflow 环境中的对象检测如所述here https tensorflow object detection api tutorial rea
在优化器期间保持变量不变

我有一个损失张量 L 的 TensorFlow 计算图它取决于 2 个 tf Variables A 和 B 我想在保持 B 固定的同时在变量 A 上运行梯度上升 A L 与 A 的梯度反之亦然在 B 上运行梯度上升 B L 与 B
Tensorflow：导入错误：libcudnn.so.7：无法打开共享对象文件：没有这样的文件或目录

我最近使用 pip 安装了tensorflow gpu 但是当我导入它时出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
提交用于 Tensorflow 对象检测的 Google Cloud ML 训练作业时出现错误消息

尝试提交 Tensorflow 对象检测任务的 Google Cloud ML 训练作业我正在遵循官方指南 https github com tensorflow models blob master research object de
如何在arm64主机上运行amd64 docker镜像

警告请求的映像平台 linux amd64 与检测到的主机平台 linux arm64 v8 不匹配并且未请求特定平台 2021 07 28 22 25 06 349222 F tensorflow core platform cpu
TF map_fn 或 while_loop 用于不同形状的张量列表

我想处理不同形状的张量序列列表并输出另一个张量列表考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
sigmoid激活函数可以用来解决Keras中的回归问题吗？

我已经用 R 实现了简单的神经网络但这是我第一次用 Keras 实现所以希望得到一些建议我在 Keras 中开发了一个神经网络函数来预测汽车销量数据集可用here https github com allmydatasets dat
mac安装Tensorflow出错

我正在尝试使用以下说明在 mac 中安装 Tensorflow https www tensorflow org install https www tensorflow org install 但是当我想导入tensorflow时我总是
Scipy 稀疏 CSR 矩阵到 TensorFlow SparseTensor - 小批量梯度下降

我有一个 Scipy 稀疏 CSR 矩阵它是根据 SVM Light 格式的稀疏 TF IDF 特征矩阵创建的特征数量巨大且稀疏所以我必须使用 SparseTensor 否则速度太慢例如特征数量为 5 示例文件如下所示 0 4 1
在 R 中使用深度网络和 MNIST 数据读取手写数字第 3 部分

我尝试编写一个基于深度网络的程序来读取手写数字我在 Youtube 上找到了一个代码 https www youtube com watch v 5bso 5X7Zu4 https www youtube com watch v 5bso
使用 TensorFlow 和 Keras 的卷积神经网络精度较低 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我计划创建一个 CNN 来预测蘑菇类型并从互联网上收集了 2500 多张照片数据集有 156 个类别不同类型的蘑菇我在 Tensorfl
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法

随机推荐

接口文档，开放

网易 http c m 163 com nc article headline T1348647853363 0 40 html 头条 http c 3g 163 com nc article list T1467284926140 0 2
DevOps 面试题集锦

注本文译自 https www javatpoint com devops interview questions 下面列出了常见的DevOps面试问题和答案 1 请解释 DevOps DevOp 是两个词的组合一个是软件 Develo
MIPI DSI 接口驱动 FPGA 模块

MIPI DSI 接口驱动 FPGA 模块在当前智能设备的快速发展和功能多样化的背景下处理高清视频流和图形数据的需求越来越高 MIPI DSI Mobile Industry Processor Interface Display Se
竞赛基于大数据的时间序列股价预测分析与可视化 - lstm

文章目录 1 前言 2 时间序列的由来 2 1 四种模型的名称 3 数据预览 4 理论公式 4 1 协方差 4 2 相关系数 4 3 scikit learn计算相关性 5 金融数据的时序分析 5 1 数据概况 5 2 序列变化情况计算最
adb 安装apk到指定设备

一打印设备代号 adb devices 红色和绿色区域为设备代号二命令 adb s 4580fa7e User aaa apk 加上 s 设备代号 apk路径替换成自己的三安装成功 Performing Streamed Inst
qrcode.js 解析二维码（源码）复制的

qrcode js 解析二维码源码复制的 var aa aa ab function f e var d qrcode width var b qrcode height var c true for var g 0 g lt e le
猿人学第二题

通过fd抓包发现他是进行了两次请求先返回的是一对script的标签定义的js代码第二次返回的才是正常的html代码打开f12进入浏览器控制台发现进入了无限debuger 那么直接在控制台中输入Function prototype c
【华为OD机试真题2023B卷 JAVA&JS】观看文艺汇演问题

华为OD2023 B卷机试题库全覆盖刷题指南点这里观看文艺汇演问题时间限制 1s 空间限制 256MB 限定语言不限题目描述为庆祝中国共产党成立100周年某公园将举行多场文艺汇演很多演出都是同时进行一个人只能同时观看一场
同时安装多台服务器系统,多服务器同时安装操作系统

多服务器同时安装操作系统内容精选换一换如果您需要使用毕昇编译器则需要先在服务端安装毕昇编译器毕昇编译器基于开源LLVM开发并进行了优化和改进同时将flang作为默认的Fortran语言前端编译器是针对鲲鹏平台的高性能编译器
python2 tensorflow_谷歌TensorFlow 2.1.0正式发布支持Python 2的最后一个 TF 版本

TensorFlow 2 1 0 正式发布了 TensorFlow 2 1 是支持 Python 2 的最后一个 TF 版本主要特性和改进如下 tensorflow pip 软件包现在默认包括针对 Linux 和 Windows 的 GP
vue组件通信总结（转）

虽然一直使用 vue 文章中的方法也一直使用但是这么齐全的总结却没有过写的不错链接
HTML lang 没你想的那么简单

前言做 web 无障碍相关的研究时遇到的第一件事就是要给设置正确的 lang 属性这么简单的一件事想也不用就写好了或者直接简写成 Bingo 可以去做其它事了但仔细想一想好像有些问题 zh 是什么鬼拼音明明是国际标准怎么
SpringBoot 添加 MDC 日志链路追踪

文章目录 1 线程池配置 2 拦截器配置 3 日志文件配置 4 异步方法使用 5 定时任务使用日志链路追踪的意思就是将一个标志跨线程进行传递在一般的小项目中也就是在你新起一个线程的时候或者使用线程池执行任务的时候会用到比如追踪一个用
shell脚本编程大全

文章目录一命令行二 shell 三文件系统四 shell命令五 shell的父子关系六内建命令七环境变量八文件系统权限九管理文件系统十构建基本shell脚本十一使用结构化命令十二处理用户输入十三呈
“赶快上车，会调用你也可以当鉴黄师了”说罢，老司机转眼间将车门焊得死死的！

都是学习用途不知道为啥图片被ban了如需查看完整图片请转移到从今天开始种树起因本人在某平台发布文章时封面用了几张美女图片内容里都是正常的流程图之类的却被这个平台告知如下内容大家评评理这图片违规么查看完整图片请转移到从今天开
上机作业：日历（java）

上机作业日历 java 1 思路框架分析本着按照手机日历的构造模型作为model 我着手开始了日历java小程序的编写说到日历就不得不提一嘴最可恶的闰年懂得都懂闰年是bug制造者这次用java语言编写我特意拿出一个方法来判断
543.二叉树的直径

543 二叉树的直径给定一棵二叉树你需要计算它的直径长度一棵二叉树的直径长度是任意两个结点路径长度中的最大值这条路径可能穿过也可能不穿过根结点本题需要明确二叉树的直径计算方法二叉树的直径不一定过根节点需要遍历左子节点和右子节点
清除pip安装库时的缓存

目录 1 命令清除缓存 2 路径手动清除在使用pip安装Python库时如果之前已经下载过该库 pip会默认使用缓存来安装库而不是重新从网络上下载缓存文件通常存储在用户目录下的缓存文件夹中具体位置因操作系统和Python版本而异
maven多环境打包实现web.xml和context.xml中的占位符变量替换

在springboot或传统springmvc的tomcat项目中为了实现spring容器文件中的变量替换我们通常可以在项目的resource目录下新建几个环境目录例如rd test dev stress online等等然后再在对
Tensorflow：BP神经网络权值初始化

一 Tensorflow入门 1 计算图每一个计算都是计算图上的一个结点而节点之间的边描述了计算之间的依赖关系支持通过tf Graph生成新的计算图不同计算图上的张量和运算不会共享 Tensorflow会自动生成一个默认的计算图如

Tensorflow：BP神经网络权值初始化

Tensorflow：BP神经网络权值初始化 的相关文章

随机推荐

热门标签

Tensorflow：BP神经网络权值初始化的相关文章