Tensorflow激活函数--tf.nn.dropout

2023-11-09

前言：激活函数（Activation Function）运行时激活神经网络中某一部分神经元，将激活信息向后传入下一层的神经网络。神经网络的数学基础是处处可微的，所以选取激活函数要保证数据输入与输出也是可微的。

### 激励函数的作用如果不使用激活函数，此时激活函数本质上相当于f(x)=ax+b。这种情况下，神经网络的每一层输出都是上层输入的线性函数。不难看出，不论神经网络有多少层，输出与输入都是线性关系，与没有隐层的效果是一样的，这个就是相当于是最原始的感知机(Perceptron)。至于感知机，大家知道其连最基本的异或问题都无法解决，更别提更复杂的非线性问题。 神经网络之所以能处理非线性问题，这归功于激活函数的非线性表达能力。

### TFLearn官方提供的激活函数：

[Activation Functions](https://www.tensorflow.org/api_guides/python/nn#activation-functions)

tf.nn.relu
tf.nn.relu6
tf.nn.crelu
tf.nn.elu
tf.nn.selu
tf.nn.softplus
tf.nn.softsign
tf.nn.dropout
tf.nn.bias_add
tf.sigmoid
tf.tanh

dropout函数会以一个概率为keep_prob来决定神经元是否被抑制。如果被抑制，该神经元输出为0，如果不被抑制则该神经元的输出为输入的1/keep_probbe倍。

每个神经元是否会被抑制是相互独立的。神经元是否被抑制还可以通过调节noise_shape来调节，当noise_shape[i] == shape(x)[i]，x中的元素是相互独立的。如果shape(x)=[k,l,m,n](k表示数据的个数，l表示数据的行数，m表示数据的列，n表示通道)，当noise_shape=[k,1,1,n]，表示数据的个数与通道是相互独立的，但是与数据的行和列是有关联的，即要么都为0，要么都为输入的1/keep_prob倍。

def dropout(incoming, keep_prob, noise_shape=None, name="Dropout"):
    """ Dropout.
    Outputs the input element scaled up by `1 / keep_prob`. The scaling is so
    that the expected sum is unchanged.
    By default, each element is kept or dropped independently. If noise_shape
    is specified, it must be broadcastable to the shape of x, and only dimensions
    with noise_shape[i] == shape(x)[i] will make independent decisions. For
    example, if shape(x) = [k, l, m, n] and noise_shape = [k, 1, 1, n], each
    batch and channel component will be kept independently and each row and column
    will be kept or not kept together.
    Arguments:
        incoming : A `Tensor`. The incoming tensor.
        keep_prob : A float representing the probability that each element
            is kept.
        noise_shape : A 1-D Tensor of type int32, representing the shape for
            randomly generated keep/drop flags.
        name : A name for this layer (optional).

下面以实例来进行说明。

import tensorflow as tf
dropout = tf.placeholder(tf.float32)
x = tf.Variable(tf.ones([10, 10]))
y = tf.nn.dropout(x, dropout)
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
a = sess.run(y, feed_dict = {dropout: 0.5})
print(a)

结果：
[[0. 2. 0. 2. 2. 2. 0. 2. 2. 2.]
 [2. 0. 0. 0. 2. 2. 0. 2. 0. 2.]
 [0. 0. 2. 2. 2. 0. 2. 2. 2. 2.]
 [0. 0. 2. 2. 0. 0. 2. 2. 0. 2.]
 [0. 2. 0. 0. 2. 0. 0. 0. 0. 0.]
 [2. 0. 0. 0. 0. 2. 0. 0. 0. 0.]
 [0. 2. 0. 0. 2. 2. 2. 0. 2. 0.]
 [0. 2. 2. 2. 0. 0. 0. 2. 0. 2.]
 [0. 0. 2. 0. 2. 2. 0. 2. 0. 0.]
 [0. 2. 2. 2. 2. 0. 2. 0. 2. 2.]]

Process finished with exit code 0

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    d = tf.constant([[1.,2.,3.,4.],[5.,6.,7.,8.],[9.,10.,11.,12.],[13.,14.,15.,16.]])
    print(sess.run(tf.shape(d)))

    #由于[4,4] == [4,4] 行和列都为独立
    dropout_a44 = tf.nn.dropout(d, 0.5, noise_shape = [4,4])
    result_dropout_a44 = sess.run(dropout_a44)
    print(result_dropout_a44)

    #noise_shpae[0]=4 == tf.shape(d)[0]=4  
    #noise_shpae[1]=1 != tf.shape(d)[1]=4
    #所以[0]即行独立，[1]即列相关，每个行同为0或同不为0
    dropout_a41 = tf.nn.dropout(d, 0.5, noise_shape = [4,1])
    result_dropout_a41 = sess.run(dropout_a41)
    print(result_dropout_a41)

    #noise_shpae[0]=1 ！= tf.shape(d)[0]=4  
    #noise_shpae[1]=4 == tf.shape(d)[1]=4
    #所以[1]即列独立，[0]即行相关，每个列同为0或同不为0
    dropout_a24 = tf.nn.dropout(d, 0.5, noise_shape = [1,4])
    result_dropout_a24 = sess.run(dropout_a24)
    print(result_dropout_a24)
    #不相等的noise_shape只能为1

结果：
[4 4]
[[  0.   4.   0.   8.]
 [  0.   0.  14.   0.]
 [  0.   0.  22.   0.]
 [  0.   0.  30.   0.]]
[[  2.   4.   6.   8.]
 [  0.   0.   0.   0.]
 [ 18.  20.  22.  24.]
 [ 26.  28.  30.  32.]]
[[  0.   0.   6.   0.]
 [  0.   0.  14.   0.]
 [  0.   0.  22.   0.]
 [  0.   0.  30.   0.]]

Droptout定义

Dropout是TensorFlow里面为了防止或减轻过拟合而使用的函数，它一般用在全连接层。
dropout 是训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch都在训练不同的网络。

参考资料：

https://blog.csdn.net/ajian0051/article/details/82315828

https://blog.csdn.net/Eclipsesy/article/details/77603336

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow激活函数--tf.nn.dropout 的相关文章

SciKit-Learn 的分解模块中未安装 LatentDirichletAllocation

我在 SciKit Learn 包中遇到了一些奇怪的问题 SciKit Learn 包内有分解模块其中应包含 LatentDirichletAllocation 函数请参阅此处的文档 https scikit learn org s
如何使用功能 API 训练 Keras 模型，该模型具有两个输入和两个输出，并使用两个 ImageDataGenerator 方法 (flow_from_directory)

我想使用 Function Keras API 创建一个模型该模型将有两个输入和两个输出该模型将使用两个实例ImageDataGenerator flow from directory 方法从两个不同的目录分别是inputs1和inp
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
如何在 Tensorflow 中计算 R^2

我正在尝试在 Tensorflow 中进行回归我不确定我计算 R 2 是否正确因为 Tensorflow 给出的答案与sklearn metrics r2 score有人可以看看我下面的代码让我知道我是否正确地实现了图中的方程谢谢
3D 卷积神经网络输入形状

我在使用 3D CNN 提供数据时遇到问题Keras http keras io和 Python 对 3D 形状进行分类我有一个文件夹其中包含一些 JSON 格式的模型我将这些模型读入 Numpy 数组模型为 25 25 25 表示
使用 keras.utils.Sequence 多处理和数据库 - 何时连接？

我正在使用 Keras 和 Tensorflow 后端训练神经网络数据集不适合 RAM 因此我将其存储在 Mongo 数据库中并使用子类检索批次keras utils Sequence 一切正常如果我跑的话model fit gene
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
从 keras 模型中将特征提取到数据集中

我使用以下代码由here https github com keras team keras blob master examples mnist cnn py 运行 CNN 来训练 MNIST 图像 from future import
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
Keras 序列模型中的数据增强层

我正在尝试将数据增强作为一个层添加到模型中但我遇到了我认为是形状问题我也尝试在增强层中指定输入形状当我取出data augmentation模型中的图层运行良好 preprocessing RandomFlip horizontal
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答

随机推荐

Catowice City【Codeforces 1248 F】【BFS】

Codeforces Round 594 Div 2 F 一开始是听闻有人说这是一道Tarjan好题然后就点进来做了但是想来想去却想了个另类的法子我们可以看到如果N个人都要选择的话那么每个人都只能是审判者或者是参赛者所以我
hutool工具常用API

hutool工具常用API 依赖工具API 1 convert 2 DataUtil 3 StrUtil 4 ClassPathResource 5 ReflectUtil 6 NumberUtil 7 BeanUtil 8 CollUt
使用C++11变长参数模板处理任意长度、类型之参数实例

变长模板变长参数是依靠C 11新引入的参数包的机制实现的一个简单的例子是std tuple的声明 template
Python六大基本数据类型介绍

Python基本数据类型一数字型一整型二浮点型三布尔型四复数类型二字符串三列表四元组五集合六字典一数字型一整型 1 整型 int 在数字中正整数 0 负整数都称为整型例 intvar 10
零知识证明zkSNARK

最近接触学习零知识证明很是头疼没有一些背景知识只能硬看了而且也没有别的好方法为什么要学习零知识证明因为区块链的去中心化导致信息都是公开透明的比特币以太坊 EOS等目前绝大部分项目区块链上的交易都是公开的发送者的地址金额
试用版MindMaster思维导图转XMind方法分享

在用MindMaster做导图的时候主题总是达到上限于是想换成没有上限的XMind 就打算把已经做好的导图转到XMind上现在网上的方法是通过导出docx文件或者复制大纲到word中然后再复制到XMind中但受试用版限制没办法导出w
调用兄弟目录中的模块

使用sys path append把父目录的加到模块搜索路径列表中即可下面是具体原理分析比如目前的目录结构如下 parDir dir1 test1 py dir2 test2 py 现在我需用在test1 py中导入dir2的test1
合泰BS8116A-3触摸芯片开发踩坑指南

一硬件说明引脚图接线说明由于用到了唤醒检测所以KEY16引脚用作IRQ中断唤醒功能未使用引脚拉低二 IIC配置说明 1 最大波特率实际单片机配置最好不要设置波特率100Khz容易出错 50Khz就可以了 2 从机地址注意
OpenCV基本知识

1 OpenCV概述 1 什么是OpenCV 开源C C 计算机视觉库面向实时应用进行优化跨操作系统硬件窗口管理器通用图像视频载入存储和获取由中高层API构成为Intel 公司的 Integrated Performan
Vue ly-tab组件使用

Vue ly tab组件的使用目录 Vue ly tab组件的使用安装引入使用安装这里使用指定版本安装如果安装其他版本使用方法可能不一致 npm install ly tab 2 1 2 S 或者 cnpm install l
深入理解采样定理 + Matlab 仿真 Sa 函数的采样与恢复

建议配合国宝老师的视频食用信号与线性系统分析吴大正郭宝龙文章目录 1 采样的说明 1 为什么要取样 2 什么是取样 2 采样定理 1 为什么要有奈奎斯特频率 2 什么是采样定理 3 信号的恢复 4 Matlab的Sa函数取样仿真 1
nginx通过四层代理实现端口转发

公司原有的测试数据库在主机192 168 10 5上边现在数据库转移到了192 168 10 4上为了不让各个地方都需要更改地址现在需要一个四层代理工具将原来请求到192 168 10 5的3306端口转发到192 168 10 4
ChatGPT数据泄露，技术细节公布

事件发生后 OpenAI 临时关闭了 ChatGPT 服务以调查问题后续 Open AI 的首席执行官 Sam Altman 也亲自发了推文承认他们确实遭遇了重大问题不过当时并没有公布问题的细节只表示是一个开源库的错误导致的由于一
支持WIN7的VSCode版本

我有台13年底买的电脑装的WIN7 使用时发现最新的VSCode已经不支持WIN7 目前VSCode官网上写的最低支持WIN8 经过确认最后支持WIN7的版本是1 70 3 不论32位还是64位都是这个版本
easyui 下拉框联动

supplierCode combobox onChange function n o var supplierCodes n join ajax type post url pageContext request contextPath
前端代码录音样式类似微信发送语音

先来上图 wxml代码不是小程序的就换成div
Python: 基于DearPyGUI的环境变量查看器

文章目录 1 目的 2 效果 3 实现思路获取环境变量分隔环境变量取值界面显示 4 代码实现 1 目的无论是 Windows 还是 Linux 下编辑环境变量总是绕不开的一个基本功也许你已经熟练使用 vim 来查询和就地替换 P
npm下载依赖报错 Invalid dependency type requested: alias

报这个是alias需要高版本的npm 查看一下npm版本 npm version alias这个好像得是6 9 0版本以上我使用的是nvm管理node版本我切换到12版本就可以了成功安装在此记录一下踩坑
强化学习的模型

文章目录前言一强化学习是什么二基本模型 1 基本框架 2 学习过程三马尔科夫决策过程 Markov Decision Process MDP 1 马尔科夫性质 2 MDP的基本组成部分 3 MDP的基本流程四基于模型和免模
Tensorflow激活函数--tf.nn.dropout

前言激活函数 Activation Function 运行时激活神经网络中某一部分神经元将激活信息向后传入下一层的神经网络神经网络的数学基础是处处可微的所以选取激活函数要保证数据输入与输出也是可微的激励函数的作用如果不使用激活函

Tensorflow激活函数--tf.nn.dropout

Tensorflow激活函数--tf.nn.dropout 的相关文章

随机推荐

热门标签