批量归一化 - Tensorflow

2024-01-01

我看过一些 BN 的例子，但还是有点困惑。所以我目前正在使用这个函数，它调用这里的函数；

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/g3doc/api_docs/python/functions_and_classes/shard4/tf.contrib.layers.batch_norm.md https://github.com/tensorflow/tensorflow/blob/master/tensorflow/g3doc/api_docs/python/functions_and_classes/shard4/tf.contrib.layers.batch_norm.md

from tensorflow.contrib.layers.python.layers import batch_norm as batch_norm
import tensorflow as tf

def bn(x,is_training,name):
    bn_train = batch_norm(x, decay=0.9, center=True, scale=True,
    updates_collections=None,
    is_training=True,
    reuse=None, 
    trainable=True,
    scope=name)
    bn_inference = batch_norm(x, decay=1.00, center=True, scale=True,
    updates_collections=None,
    is_training=False,
    reuse=True, 
    trainable=False,
    scope=name)
    z = tf.cond(is_training, lambda: bn_train, lambda: bn_inference)
    return z

接下来的部分是一个玩具运行，我只是检查函数是否重用了在两个特征的训练步骤中计算的均值和方差。在测试模式下运行这部分代码，即is_training=False，在训练步骤中计算的运行均值/方差正在发生变化，当我们打印出我通过调用获得的 BN 变量时可以看到这一点bnParams

if __name__ == "__main__":
    print("Example")

    import os
    import numpy as np
    import scipy.stats as stats
    np.set_printoptions(suppress=True,linewidth=200,precision=3)
    np.random.seed(1006)
    import pdb
    path = "batchNorm/"
    if not os.path.exists(path):
        os.mkdir(path)
    savePath = path + "bn.model"

    nFeats = 2
    X = tf.placeholder(tf.float32,[None,nFeats])
    is_training = tf.placeholder(tf.bool,name="is_training")
    Y = bn(X,is_training=is_training,name="bn")
    mvn = stats.multivariate_normal([0,100])
    bs = 4
    load = 0
    train = 1
    saver = tf.train.Saver()
    def bnCheck(batch,mu,std):
        # Checking calculation
        return (x - mu)/(std + 0.001)
    with tf.Session() as sess:
        if load == 1:
            saver.restore(sess,savePath)
        else:
            tf.global_variables_initializer().run()
        #### TRAINING #####
        if train == 1:
            for i in xrange(100):
                x = mvn.rvs(bs)
                y = Y.eval(feed_dict={X:x, is_training.name: True})

        def bnParams():
            beta, gamma, mean, var = [v.eval() for v in tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES,scope="bn")]
            return beta, gamma, mean, var

        beta, gamma, mean, var = bnParams()
        #### TESTING #####
        for i in xrange(10):
            x = mvn.rvs(1).reshape(1,-1)
            check = bnCheck(x,mean,np.sqrt(var))
            y = Y.eval(feed_dict={X:x, is_training.name: False})
            print("x = {0}, y = {1}, check = {2}".format(x,y,check))
            beta, gamma, mean, var = bnParams()
            print("BN Params: Beta {0} Gamma {1} mean {2} var{3} \n".format(beta,gamma,mean,var))

        saver.save(sess,savePath)

测试循环的前三次迭代如下所示；

x = [[  -1.782  100.941]], y = [[-1.843  1.388]], check = [[-1.842  1.387]]
BN Params: Beta [ 0.  0.] Gamma [ 1.  1.] mean [ -0.2   99.93] var[ 0.818  0.589] 

x = [[  -1.245  101.126]], y = [[-1.156  1.557]], check = [[-1.155  1.557]]
BN Params: Beta [ 0.  0.] Gamma [ 1.  1.] mean [  -0.304  100.05 ] var[ 0.736  0.53 ] 

x = [[ -0.107  99.349]], y = [[ 0.23  -0.961]], check = [[ 0.23 -0.96]]
BN Params: Beta [ 0.  0.] Gamma [ 1.  1.] mean [ -0.285  99.98 ] var[ 0.662  0.477]

我不做 BP，所以 beta 和 gamma 不会改变。然而我的跑步方式/差异正在改变。我哪里错了？

编辑：最好知道为什么这些变量需要/不需要在测试和训练之间改变；

updates_collections, reuse, trainable

你的 bn 函数是错误的。使用这个代替：

def bn(x,is_training,name):
    return batch_norm(x, decay=0.9, center=True, scale=True,
    updates_collections=None,
    is_training=is_training,
    reuse=None,
    trainable=True,
    scope=name)

is_training 是 bool 0-D 张量，表示是否更新运行平均值等。然后，只需更改张量 is_training 即可表明您处于训练阶段还是测试阶段。

编辑：张量流中的许多操作接受张量，而不是常量 True/False 数字参数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

批量归一化 - Tensorflow 的相关文章

用于测试张量流安装的速度基准

我怀疑我的 GPU 机器上是否正确配置了张量流因为在我精美的 GPU 机器上训练一个简单的线性回归模型批量大小 32 1500 个输入特征 150 个输出变量的每次迭代速度比在笔记本电脑上慢 100 倍我使用的是 Titan X 配
AttributeError：模块“keras.engine”没有属性“Layer”

当我试图运行时Parking Slot mask rcnn py文件我收到如下错误mrcnn model py文件我该如何解决 gt 2021 06 17 08 25 18 585897 W tensorflow stream execut
使用 flow_from_dataframe y_col 的正确“值”是什么

我正在用 pandas 读取 csv 文件并给出存储在中的列名称colname colnames file label Read data from file data pd read csv Hand Annotations 2 csv
从 Keras 检查点加载

我正在 Keras 中训练一个模型我使用以下代码保存了所有内容 filepath project model hdh5 checkpoint ModelCheckpoint project model hdf5 monitor loss
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
交换keras中的张量轴

我想将图像批次的张量轴从 batch size row col ch 交换为批次大小通道行列在 numpy 中这可以通过以下方式完成 X batch np moveaxis X batch 3 1 我该如何在 Keras 中做到
在tensorflow.js中对张量进行分区、屏蔽或过滤

我有 2 个相同长度的张量 data and groupIds 我想分开data通过相应的值分成几组groupId 例如 const data tf tensor 1 2 3 4 5 const groupIds tf tensor 0 1
如何在 py_function 之后重塑（图像，标签）数据集

我正在尝试读取自定义映射数据集进行训练但是在使用 py function 映射数据集后我得到了未知的形状例如 def process path file path label get label file path img tf io
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
ExpirationError（代码= StatusCode.DEADLINE_EXCEEDED，详细信息=“超过截止日期”）

我正在关注tutorial https www youtube com watch v T afaArR0E8用于使用tensorflow services部署inception模型我使用的是ubuntu 16 04和bazel 13 0
如何从张量流数据集迭代器返回同一批次两次？

我正在转换一些旧代码以使用数据集 API 此代码使用feed dict将一批数据送入列车运行实际上是三次然后重新计算损失以供显示使用同一批所以我需要一个迭代器来返回完全相同的批次两次或多次不幸的是我似乎找不到一种使用张量流数据集
TensorFlow Bazel 构建失败

我正在使用 Bazel 构建 TensorFlowbazel build c opt config cuda tensorflow cc tutorials example trainer按照 TensorFlow 的指示从源安装说明
如何在对象检测 API 中同时训练和评估？

我想同时在我自己的数据集上训练评估 ssd mobilenet v1 cocoObject Detection API 然而当我尝试这样做时我面临着 GPU 内存几乎已满因此评估脚本无法启动以下是我用于训练和评估的命令在一个终端
如何使用 Python 多处理避免在分叉进程中加载父模块

当您创建一个Pool使用Python的进程multiprocessing 这些进程将分叉父进程中的全局变量将显示在子进程中如下面的问题所述如何限制多处理进程的范围 https stackoverflow com questions 2
Tensorflow 检查点模型被删除

我使用以下代码每 10 个时期后使用张量流检查点 checkpoint dir os path abspath os path join out dir checkpoints checkpoint prefix os path join
TensorFlow 中的 FCN 缺少裁剪层

我目前正在尝试实施用于语义分割的 FCN http www cs berkeley edu jonlong long shelhamer fcn pdf在 TensorFlow 中就像之前在 Caffe 中一样here https git
使用 WALS 方法在 Tensorflow 2.0 中进行矩阵分解

我使用 WALS 方法来执行矩阵分解最初在tensorflow 1 13中我可以使用导入factorization ops from tensorflow contrib factorization python ops import f
Tensorflow ValueError：形状 (?, 1) 和 (?,) 不兼容

当我用 3 个 lstm 层运行代码时我遇到了这个错误不知道如何修复它任何人都可以帮忙这里 MAX SEQUENCE LENGTH 250 运行成本函数后我收到错误 ValueError 形状 1 和不兼容 Generate a
tf.reshape 与 tf.contrib.layers.flatten

所以我正在运行 CNN 来解决分类问题我有 3 个转换层和 3 个池化层 P3是最后一个池化层的输出其维度为 Batch size 4 12 48 我想将该矩阵展平为 Batch size 2304 尺寸矩阵为2304 4 12 48
tensorflow Protobuf编译问题

我想为 google 对象检测 API 编译 protobuf 库我按照官方教程输入protoc object detection protos proto python out 然后我得到的是 object detection prot

随机推荐

Hibernate问题：必须出现在GROUP BY子句中或在聚合函数中使用

我想运行的查询 SELECT date trunc month UA activity date SUM UA points FROM user activity UA WHERE UA activity date gt 01 01 201
VM初始化时出错；无法为对象堆保留足够的空间；无法创建Java虚拟机

我遇到了这个java问题 root peach sbin java Error occurred during initialization of VM Could not reserve enough space for object h
设置最小密码长度 Firebase 电子邮件和密码身份验证

使用 Firebase 电子邮件和密码设置时密码似乎没有安全限制例如我可以创建以下用户 firebaseRef createUser email email protected cdn cgi l email protection pa
用于生物信息学/生物统计学/医学研究的 Clojure 或 Scala [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我不是一个专业的程序员我的领域是医学研究但我对C C 和各种脚本语言相当有能力不久前我对 Lisp 很感兴趣但一直没有时间认真学习它短
Django可以自动创建相关的一对一模型吗？

我在不同的应用程序中有两个模型 ModelA and ModelB 他们有一对一的关系有没有办法让django自动创建并保存ModelB when ModelA被救了吗 class ModelA models Model name mod
如何在 ASP.NET MVC 中禁用客户端和代理缓存？

在 ASP NET MVC 中禁用页面缓存的正确与浏览器无关方法是什么尝试这个 OutputCache NoStore true Duration 0 VaryByParam public ActionResult NonCachea
Python：Groupby 第一个非 NaN 值

我有以下数据框 id number 1 13 1 13 1 NaN 1 NaN 2 11 2 11 2 11 2 NaN 我想找到每个 id 的第一个非 NaN 值并用 1 标记它结果应如下所示 id number code 1 13 N
如何在D3中点击添加或拖动？

我的印象是这个问题太简单了没有人费心去制作它的演示但我对 D3 的了解还不够多无法看出我做错了什么我正在寻找的行为是如果用户单击没有圆圈的地方它将在那里创建一个圆圈如果他们拖动现有的圆圈则不会创建新的圆圈但他们拖动的圆圈将
Firebase - 创建临时用户直到用户注册

我有一个用例用户 A 可以说用户 B 从用户 A 借了一些钱类似于 Splitwise 等应用程序我正在使用 firestore 来存储数据在这种特殊情况下我将其作为文档存储在 Transactions 集合中该集合将具有以下字
CEdit::GetLine() Windows 7

我有以下代码段其中m edit是一个 CEdit 控件 TCHAR lpsz MAX PATH 1 get the edit box text m edit GetLine 0 lpsz MAX PATH 这在运行 Windows XP
在 C# 中使用原始套接字

我想用 C 编写一个端口扫描器但无法使用 SocketType Raw 因为原始套接字是从 Windows 桌面版本中取出的我无法使用 SharpPcap 或 Winpcap 的其他包装器因为我使用 PPPoE 进行互联网连接而 W
检查奇数时 & 比 % 更快吗？

要检查奇数和偶数最低位检查是否比使用模数更有效 gt gt gt def isodd num return num 1 and True or False gt gt gt isodd 10 False gt gt gt isodd 9
MySQL 有命名约定吗？

我是这样做的表名是小写的使用下划线分隔单词并且是单数例如foo foo bar etc 我通常并非总是有一个自动增量 PK 我使用以下约定 tablename id e g foo id foo bar id etc 当表包含作
xmlHttpRequest.onerror 处理程序用例

什么样的情况会导致调用此处理程序我没有找到此方法引发错误的任何实例我尝试让设备离线我得到xmlHttpRequest status 0但没有错误问题是我可以创建什么样的情况来测试此处理程序的功能 var xmlhttp new XM
C++/CLI 中的文字字段与常量变量

我正在阅读一些 C CLI 材料并且遇到了文字字段的概念 literal int inchesPerFoot 12 这比 const 更好吗因为 constFIELD不能存在因为字段无法初始化自身所以 class aClass pr
如何通过 Azure DevOps 在 Dockerfile 中设置环境变量

在我的项目 Docker 文件中我有一些环境变量如下所示 ENV ACCEPT EULA Y ENV SA PASSWORD Password ENV MSSQL PID Developer ENV MSSQL TCP PORT 143
在应用程序域之间来回传递集合对象

以下示例基于在应用程序域之间来回传递值 https stackoverflow com questions 1250774 passing values back and forth appdomains 其中 Marc Gravell
扩展运算符类似物

我有一个结构体和该结构体的实例 type Obj struct ssid string code string mit string and other props 23 var ValidObject Obj ssid AK93 KADJ
Android 应用程序连接到网络服务 - 不工作

我正在尝试将我的应用程序连接到我在 asp net 中创建的 WCF 服务该服务在我的本地计算机上运行 http localhost 8080 Service svc http localhost 8080 Service svc 但由于
批量归一化 - Tensorflow

我看过一些 BN 的例子但还是有点困惑所以我目前正在使用这个函数它调用这里的函数 https github com tensorflow tensorflow blob master tensorflow g3doc api docs

批量归一化 - Tensorflow

批量归一化 - Tensorflow 的相关文章

随机推荐

热门标签