张量流中的批量归一化

2024-04-04

我注意到张量流的 api 中已经有批量归一化函数。但我不明白的一件事是如何更改训练和测试之间的程序？

批量归一化在测试期间的行为与训练期间的行为不同。具体来说，在训练期间使用固定的均值和方差。

某处有一些好的示例代码吗？我看到了一些，但是对于作用域变量，它变得令人困惑

你是对的，tf.nn.batch_normalization仅提供实现批量归一化的基本功能。您必须添加额外的逻辑来跟踪训练期间的移动均值和方差，并在推理期间使用经过训练的均值和方差。你可以看看这个example https://github.com/tensorflow/models/blob/master/inception/inception/slim/ops.py#L116对于一个非常通用的实现，但是一个不使用的快速版本gamma在这儿：

  beta = tf.Variable(tf.zeros(shape), name='beta')
  moving_mean = tf.Variable(tf.zeros(shape), name='moving_mean',
                                 trainable=False)
  moving_variance = tf.Variable(tf.ones(shape),
                                     name='moving_variance',
                                     trainable=False)
  control_inputs = []
  if is_training:
    mean, variance = tf.nn.moments(image, [0, 1, 2])
    update_moving_mean = moving_averages.assign_moving_average(
        moving_mean, mean, self.decay)
    update_moving_variance = moving_averages.assign_moving_average(
        moving_variance, variance, self.decay)
    control_inputs = [update_moving_mean, update_moving_variance]
  else:
    mean = moving_mean
    variance = moving_variance
  with tf.control_dependencies(control_inputs):
    return tf.nn.batch_normalization(
        image, mean=mean, variance=variance, offset=beta,
        scale=None, variance_epsilon=0.001)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

recurrentneuralnetwork

张量流中的批量归一化的相关文章

Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
Tensorflow 的 LSTM 输入

I m trying to create an LSTM network in Tensorflow and I m lost in terminology basics I have n time series examples so X
如何创建 Keras 层来执行 4D 卷积 (Conv4D)？

看起来tf nn convolution应该能够进行 4D 卷积但我无法成功创建 Keras 层来使用此函数我尝试过使用 KerasLambda层来包裹tf nn convolution功能但也许其他人有更好的主意我想利用数据的高维
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
TensorFlow：有没有办法将冻结图转换为检查点模型？

可以将检查点模型转换为冻结图 ckpt 文件转换为 pb 文件但是是否有反向方法将 pb 文件再次转换为检查点文件我想它需要将常量转换回变量有没有办法将正确的常量识别为变量并将它们恢复回检查点模型目前支持将变量转换为常量 http
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
如何在google colab中降级到tensorflow-gpu版本1.12

我正在运行一个仅与旧版本的tensorflow GPU兼容的GAN 因此我需要将google colab中的tensorflow gpu从1 15降级到1 12 我尝试使用本中建议的以下命令thread https stackoverflo
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Tensorflow中通过字符串选择不同的模式

我正在尝试构建一个 VAE 网络我希望模型在不同的模式下做不同的事情我有三种模式训练相同和不同以及一个名为 interpolation mode 的函数它根据模式执行不同的操作我的代码如下所示 import tensorf
Tensorflow 中的图像叠加图像卷积

假设我有两组图像 A 和 B 每个图像都是 11X5x5x3 其中 11 是示例数量 5x5x3 是图像尺寸 Tensorflow 中是否有一种简单的方法可以对 A i 中的每个图像应用 B i 上的卷积即 B i 扮演过滤器角色 A i
如何使用 Tensorflow-GPU 和 Keras 修复低易失性 GPU-Util？

我有一台 4 GPU 机器在上面运行带有 Keras 的 Tensorflow GPU 我的一些分类问题需要几个小时才能完成 nvidia smi returns Volatile GPU Util which never exceeds
在张量流中向卷积神经网络提供可变大小的输入

我正在尝试使用 feed dict 参数将不同大小的 2d numpy 数组列表传递给卷积神经网络 x tf placeholder tf float32 batch size None None None y tf placeholder

随机推荐

jQuery Mobile 通过 ajax 动态创建可折叠集不应用样式[重复]

这个问题在这里已经有答案了可能的重复动态添加可折叠元素 https stackoverflow com questions 4214538 dynamically adding collapsible elements 我正在动态创建一
为什么是“unsigned int ui = {-1};”缩小转换误差？

标准第 8 5 4 7 解释了什么是缩小转换范围 is 缩小转换是隐式转换从浮点类型到整数类型或者从 long double 到 double 或 float 或者从 double 到 float 除非源是常量表达式与转换后的实际值
DatePicker Blackout日期所有未来和一些过去

我有一个 WPF 应用程序需要使用 DatePicker 提供出生日期除了 134 年前以及之后的所有时间之外我还想删除明天和其余时间的日期我尝试使用 BlackoutDates 来完成此任务因为我们仍然希望允许手动用户输入但我
使用 Curl 发布 xml 时权限被拒绝？

我必须将 xml 发布到某个 url 以便由某些 Web 服务使用我正在使用 Cent OS 5 6 Apache 2 2 3 CentOS 当我使用命令行发布时curl d abc xml http example com它给了我结果
使用 appium 自动登录过程时，密码和用户名被输入在用户名的同一字段中

尽管测试清晰简单但我在尝试发送密钥用户名密码时总是面临同样的问题但密码字段是写在用户名的位置这是我的测试 NG 我使用 appium 进行测试 Test public void Test1 throws InterruptedE
将 iOS 和 Android 客户端连接到 SockJS 后端

我正在使用开发 WebSocket 消息传递后端Spring WebSockets https spring io guides gs messaging stomp websocket 它使用SockJS STOMP协议之所以不使用普通
通过 SSO 进行 Maven 设置？

我有一些开发人员对于将 LDAP 用户名密码存储在 settings xml 中以便访问 Nexus 感到不满意他们的不满部分是出于 FUD 但也因为每当 LDAP 密码过期时都必须重新加密密码这种情况在此处相对常见带来的不便有什
Airflow：只有一项任务的简单 DAG 永远不会完成

我制作了一个非常简单的 DAG 如下所示 from datetime import datetime from airflow import DAG from airflow operators bash operator import B
服务器显示文本而不是 HTML

我正在尝试创建一个 C 服务器它将接受输入并能够通过 html 格式将它们返回给用户其中服务器充当用户界面我当前的问题似乎无法弄清楚为什么 C 服务器在 localhost 3838 处将 HTML 代码以文本形式吐出而不是将其显示
在 PHP 中，为什么“or die()”可以工作，而“or return”却不行？

在 PHP 中您可以通过调用来处理错误or die当遇到某些错误时退出如下所示 handle fopen location r or die Couldn t get handle Using die 不是处理错误的好方法我宁愿返回一
C# 服务器和 Java 客户端：TCP 套接字通信问题

我用 C 编写了一个服务器程序TCPListner和一个使用套接字的 Java 客户端程序但我无法将复杂的对象从 Java 客户端发送到 C 服务器当我通过将字符串转换为字节数组从 Java 客户端发送到 C 服务器时当转换回字符串时
Ansible设置mysql root密码

你们中有人有想法构建一个 yml 用于 mysql 更新 root 密码并授予权限吗我已经创建了我的剧本并且在全新安装时它按预期工作完全没有问题但是当我再次进行 vagrant 配置时它现在无法设置 root 密码并且出现错误
按排序顺序将元素插入数组

我正在尝试按排序顺序将元素添加到数组中这是我的代码 public class SortedInsertion public static void main String args int arr new int 6 arr 0 5 ar
LINQ如何返回最后一个日期以及第一个和最后一个计数之间的差异

我有一个包含以下列和示例数据的表 acteename updated at count count is not sorted in db dev 52 2 7 2020 5 56 43 PM 1 dev 52 2 7 2020 5 56
根据 Woocommerce 中的特定产品数量渐进式固定优惠券折扣

我有一个小问题不知道如何解决自己我想在我的 Woocommerce 商店中仅针对一种产品使用此逻辑我使用这样的链接来自动应用优惠券代码并添加到购物车 https testsite com checkout add to cart Pr
Videojs仅添加播放控件

我在用Video js在我的网页中播放视频我想将播放器控件自定义为仅播放按钮我的代码是
如何构建/编译 ndk 应用程序？

嗨现在我正在下载 ndk 但我不知道如何构建和编译实际上我是 Android 应用程序的新手现在我正在使用 linux 并且我不太擅长命令行 embdes embdes laptop cd home embdes projects a
如何从简单的 jsdom 函数返回值？

我将 jsdom 与 jquery 一起使用并且运行得很好然而我试图将我的代码模块化一点这样我就不会重复自己所以我用一些 jsdom 代码创建了一个基本函数它接受一些 html DOM 用 jquery 调整它然后将其吐出来
AngularJS：避免在收到响应之前两次调用相同的 REST 服务

我有两个指令每个指令都使用包装 q http 调用的同一工厂 angular module demo directive itemA restService function restService return restrict A l
张量流中的批量归一化

我注意到张量流的 api 中已经有批量归一化函数但我不明白的一件事是如何更改训练和测试之间的程序批量归一化在测试期间的行为与训练期间的行为不同具体来说在训练期间使用固定的均值和方差某处有一些好的示例代码吗我看到了一些但是对于作

张量流中的批量归一化

张量流中的批量归一化 的相关文章

随机推荐

热门标签

张量流中的批量归一化的相关文章