为什么在张量流中的 tf.nn.dropout 中对输入进行缩放？

2024-02-02

I can't understand why dropout works like this in tensorflow. The blog of CS231n http://cs231n.github.io/neural-networks-2/ says that, "dropout is implemented by only keeping a neuron active with some probability p (a hyperparameter), or setting it to zero otherwise." Also you can see this from picture(Taken from the same site)

来自张量流网站，With probability keep_prob, outputs the input element scaled up by 1 / keep_prob, otherwise outputs 0.

现在，为什么输入元素按比例放大1/keep_prob？为什么不按概率保持输入元素原样，而不用1/keep_prob?

这种扩展使得相同的网络能够用于训练（使用keep_prob < 1.0）和评估（与keep_prob == 1.0）。来自辍学纸 http://www.cs.toronto.edu/~rsalakhu/papers/srivastava14a.pdf:

这个想法是在测试时使用单个神经网络而不丢失。该网络的权重是训练权重的缩小版本。如果一个单位以概率被保留p在训练期间，该单元的输出权重乘以p测试时如图2所示。

而不是添加操作来缩小权重keep_prob在测试时，TensorFlow 实现添加了一个操作来扩大权重1. / keep_prob在训练时。对性能的影响可以忽略不计，并且代码更简单（因为我们使用相同的图并对待keep_prob as a tf.placeholder() https://www.tensorflow.org/versions/master/api_docs/python/io_ops.html#placeholder根据我们是在训练还是评估网络，它会被赋予不同的值）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么在张量流中的 tf.nn.dropout 中对输入进行缩放？的相关文章

scikit-learn 适合大数据任务吗？

我正在研究一项涉及使用机器学习技术的 TREC 任务其中数据集由超过 5 TB 的 Web 文档组成计划从中提取词袋向量 scikit learn有一组不错的功能似乎可以满足我的需求但我不知道它是否能够很好地扩展以处理大数据例如是
Tensorflow Eager Execution 不适用于学习率衰减

在这里尝试让一个热切的执行模型与 LR 衰减一起工作但没有成功这似乎是一个错误因为学习率衰减张量似乎没有更新如果我遗漏了什么你可以帮我一下吗谢谢下面的代码正在学习一些词嵌入但是那学习率衰减部分根本不起作用 class Wo
如何处理分类中的低频样本？

我面临一个文本分类问题我需要将示例分类为 34 组问题是 34组的训练数据大小不平衡对于某些组我有 2000 多个示例而对于某些组我只有 100 多个示例对于一些小群体分类准确率相当高我想这些群体可能有特定的关键词来识别和
Tensorflow：ValueError：形状必须具有相同的等级，但为 0 和 2

我在乘以 x1 Wo1 时遇到形状错误但我找不到原因错误 ValueError 形状必须具有相同的等级但为 0 和 2将形状 0 与其他形状合并对于 add 2 x 操作 Pack 输入形状 20 1 import tensorfl
安装了tensorflow，但pycharm忽略它

我安装了tensorflow 约书亚的回答如何在anaconda python 3 6上安装tensorflow https stackoverflow com questions 43419795 how to install tens
Tensorflow 检查点模型被删除

我使用以下代码每 10 个时期后使用张量流检查点 checkpoint dir os path abspath os path join out dir checkpoints checkpoint prefix os path join
tensorflow ValueError：特征应该是“张量”的字典。给定类型：

这是我的代码我的tensorflow版本是1 6 0 python版本是3 6 4 如果我直接使用数据集读取csv文件我可以训练并且没有错误但我将 csv 文件转换为 tfrecords 文件这是错误的我在互联网上谷歌了一下几乎
TensorFlow 中的 FCN 缺少裁剪层

我目前正在尝试实施用于语义分割的 FCN http www cs berkeley edu jonlong long shelhamer fcn pdf在 TensorFlow 中就像之前在 Caffe 中一样here https git
模型返回错误 - ValueError：logits 和标签必须具有相同的形状 ((None, 18) vs (None, 1))

我正在使用基于 keras 的多标签分类器我创建了一个加载训练和测试数据的函数然后在函数本身内处理拆分 X Y 我在运行模型时遇到错误但不太确定其含义这是我的代码 def KerasClassifer df train df te
Keras 中 Adam 优化器的衰减参数

我认为 Adam 优化器的设计可以自动调整学习率但是 Keras 中有一个选项可以明确提及 Adam 参数选项中的衰减我想澄清衰减对 Keras 中 Adam 优化器的影响如果我们在 lr 0 001 上使用衰减例如 0 01 编译
Tensorflow 保存子类模型，该模型具有 call() 方法的多个参数

我正在关注张量流神经机器翻译教程 https www tensorflow org tutorials text nmt with attention https www tensorflow org tutorials text nmt
了解 scikit-learn GridSearchCV - 参数调整和平均性能指标

我试图了解 scikit learn 中的 GridSearchCV 究竟如何实现机器学习中的训练验证测试原理正如您在下面的代码中看到的我理解它的作用如下将数据集分为 75 和 25 其中 75 用于参数调整 25 是保留的测
Keras 均方误差损失层

我目前正在实现一个自定义损失层在此过程中我偶然发现了 Objectives py 文件 1 中均方误差的实现我知道我对这种损失计算的理解遗漏了一些东西因为我一直认为平均值是在每个小批量张量的轴 0 中的每个输出的样本之间单独完成的
为什么我的 GradientDescentOptimizer 会产生 NaN？

我目前正在修改 Andrew Ng 教授在 Coursera 上的机器学习课程作业但我陷入了逻辑回归部分 filename data ex2data1 txt data np loadtxt filename delimiter un
R 中 Tomek 链接的快速计算

我想实现 tomek 的链接来处理不平衡数据此代码用于二分类问题其中 1 类是多数类 0 类是少数类 X 为输入 Y 为输出我已经编写了以下代码但我正在寻找一种加快计算速度的方法我该如何改进我的代码 remove overlapp
针对测试数据集使用 cross_val_predict

我对在测试数据集中使用 cross val predict 感到困惑我创建了一个简单的随机森林模型并使用 cross val predict 进行预测 from sklearn ensemble import RandomForestCl
张量流范围名称有哪些限制？

我正在运行张量流模型并收到以下错误 ValueError Cement component 1 kg in a m 3 mixture is not a valid scope name 我知道张量流可能不喜欢其范围名称中的特殊字符和空格
在机器学习中使用 Scikit 对邮政编码进行特征哈希

我正在研究一个机器学习问题我的数据集中有很多邮政编码 8k 唯一值因此我决定将这些值散列到更小的特征空间中而不是使用 OHE 之类的东西我遇到的问题是我的哈希中唯一行的比例非常小 20 这基本上意味着根据我的理解我有很多重复冲
TensorFlow 的 Print 或 K.print_tensor 不会在损失函数中打印中间张量

我为 Keras 模型编写了一个相当复杂的损失函数并且它不断返回nan训练时因此我需要在训练时打印中间张量我知道你不能在损失函数中执行 K eval 因为张量未初始化不过我都尝试过K print tensor and tf Pr
MATLAB 中的神经网络

我在 MATLAB 中训练了异或神经网络并得到了这些权重 iw 2 162 2 1706 2 1565 2 1688 lw 3 9174 3 9183 b 1 2 001 2 0033 b 2 3 8093 出于好奇我尝试编写 MATLA

随机推荐

在一台机器上运行多个 MySQL 服务器

我们可以在一台机器上运行多个 MySQL 服务器吗 Thanks 是的您只需在单独的端口上运行它们并将它们指向不同的 lib 目录以获取其数据这是一个很好的参考 http dev mysql com doc refman 5 1 en
ASP.NET C# 大文件上传时出现 OutofMemoryException

我有以下文件上传处理程序 public class FileUploader IHttpHandler public void ProcessRequest HttpContext context HttpRequest request c
如何在表过滤器中显示“未找到记录”消息

我根据两个 tds 在我的桌子上应用过滤器过滤器正在工作但如果没有值匹配我想显示未找到记录消息这是一个示例演示 filter click function var tdScoring tdEarning var scoring
AttributeError：“NoneType”对象没有属性“dpi_scale_trans”

通过 StackOverflow 检查我遇到的上述错误的可能解决方案后我发现一些解决方案无法解决这个特定问题下图显示了尝试在图上绘制多个轴时遇到的错误和获得的不需要的图 This is an image of the expected
错误模板设计

似乎我在这个网站上读到了关于这个问题的另一个问题答案但我不记得答案是什么现在我找不到原始帖子我不喜欢 WPF 中的默认错误模板我了解如何更改此错误模板但是如果我将一些内容添加到文本框的末尾则文本框的大小不会改变并且添加的内
Collections.shuffle() 真的足够随机吗？实际例子似乎否定了这个说法

我有 1000 个独特的对象java util List 每个都引用一个图像 1000 个列表中的每个图像都是唯一的现在我想对它们进行洗牌以便我可以使用前 20 个对象并将它们呈现给网站用户然后用户可以单击随机播放按钮然后我再
Cordova 应用程序中的触发事件

我正在尝试触发事件 backbutton pause resume等从浏览器手动在cordova中用于调试我按照以下方式进行 window trigger backbutton 当我们使用注册事件处理程序时 document on b
如何使 Selenium 不等待整个页面加载，其脚本速度很慢？

硒driver get url 等到整页加载但是抓取页面会尝试加载一些无效的 JS 脚本所以我的 Python 脚本等待它并且几分钟后不起作用这个问题可能出现在网站的每个页面上 from selenium import webdriv
Javascript 数组和 Meteor 会话

我做了一个有趣的观察当尝试更新存储在 Meteor 会话存储中的数组时以下代码将不会传播更改 var tags Session get Tags tags push a Session set Tags tags 但是如果我改变第一行来
如何检测 tcp 连接是否已从 ssl 连接转发？

我正在处理的具体场景是尝试连接到 AWS 弹性负载均衡器后面的 websocket 连接同时强制使用 https ssl 而不是 http tcp 要启用从 http s 的 TCP SSL 升级负载均衡器上的协议必须在端口 80 上设
如何防止 NULL 值插入到 Jackson 中的 ObjectNode

我希望杰克逊在将空值放入 ObjectNode 实例时忽略它们我知道如何在序列化 pojo 时防止空值这里我手动将键值放入 ObjectNode 实例中并且我希望杰克逊在值为空时忽略要忽略的键值例如 objectNode put
从 Android 应用程序使用 OAuth2 访问 Gmail Atom feed 停止工作

我有一个 Android 应用程序它可以访问 Gmail Atom 收件箱提要以只读方式访问未读电子邮件这就是我所需要的而且它最近停止工作了它正在使用OAuth2 and 谷歌验证工具这是它的工作原理在服务中使用 Async
如何让jquery select2动态禁用一个选项？

我有一些多选我使用 jquery select2 当在一个多选中选择此选项时我想禁用其他多选中的一个选项我写了这段代码但它确实有效 select multiselect on change function e if e added
|1 在 Docker 历史中意味着什么

鉴于这种Dockerfile FROM debian 8 3 ARG TEST 123 RUN echo TEST 什么是 1在 Docker 历史上有哪些代表 docker history 2feee0d8320f IMAGE CREAT
EF Core - 如何使用值对象审计跟踪

我正在尝试对 Entity Framework Core 中选择的类实现审计跟踪跟踪更改内容更改时间和更改者我当前的实现依赖于覆盖 SaveChangesAsync public override Task
pthread_join 中的“状态”到底代表什么以及如何查询它

我想知道 pthread join 中的 status 参数到底是用来做什么的 int pthread join pthread t thread void status 我正在尝试利用它但我无法理解它到底代表什么根据文档 status
未捕获（承诺中）DOMException：无法在“WebGL2RenderingContext”上执行“texImage2D”：可能无法加载受污染的画布

img src
在 AWS Elastic Beanstalk 上安装 php mongo 驱动程序

我正在尝试在 Elastic Beanstalk 上部署 php 应用程序除了我给 mongo 驱动程序打电话之外一切都工作正常我尝试按照以下步骤安装它未成功 SSH 到 Elastic Beanstalk 实例 sudo yum
我应该如何组织代码的后端和前端？

我有一个项目我为后端 Flask Python 编写了很多代码为前端 Vue 编写了很多代码到目前为止它们一直是单独的文件夹 Github 存储库我想知道将它们组合在一起的典型情况是什么 1 Github 存储库和 2 文件结构
为什么在张量流中的 tf.nn.dropout 中对输入进行缩放？

I can t understand why dropout works like this in tensorflow The blog of CS231n http cs231n github io neural networks 2

为什么在张量流中的 tf.nn.dropout 中对输入进行缩放？

为什么在张量流中的 tf.nn.dropout 中对输入进行缩放？ 的相关文章

随机推荐

热门标签

为什么在张量流中的 tf.nn.dropout 中对输入进行缩放？的相关文章