使用张量流实现 RBM

2024-04-20

我正在尝试用tensorflow实现RBM，代码如下：

rbm.py

""" An rbm implementation for TensorFlow, based closely on the one in Theano """
import tensorflow as tf
import math
def sample_prob(probs):
    return tf.nn.relu(
        tf.sign(
            probs - tf.random_uniform(probs.get_shape())))
class RBM(object):
    def __init__(self, name, input_size, output_size):
        with tf.name_scope("rbm_" + name):
            self.weights = tf.Variable(
                tf.truncated_normal([input_size, output_size],
                    stddev=1.0 / math.sqrt(float(input_size))), name="weights")
            self.v_bias = tf.Variable(tf.zeros([input_size]), name="v_bias")
            self.h_bias = tf.Variable(tf.zeros([output_size]), name="h_bias")

    def propup(self, visible):
        return tf.nn.sigmoid(tf.matmul(visible, self.weights) + self.h_bias)

    def propdown(self, hidden):
        return tf.nn.sigmoid(tf.matmul(hidden, tf.transpose(self.weights)) + self.v_bias)

    def sample_h_given_v(self, v_sample):
        return sample_prob(self.propup(v_sample))

    def sample_v_given_h(self, h_sample):
        return sample_prob(self.propdown(h_sample))

    def gibbs_hvh(self, h0_sample):
        v_sample = self.sample_v_given_h(h0_sample)
        h_sample = self.sample_h_given_v(v_sample)
        return [v_sample, h_sample]

    def gibbs_vhv(self, v0_sample):
        h_sample = self.sample_h_given_v(v0_sample)
        v_sample = self.sample_v_given_h(h_sample)
        return  [h_sample, v_sample]

    def cd1(self, visibles, learning_rate=0.1):
        h_start = self.propup(visibles)
        v_end = self.propdown(h_start)
        h_end = self.propup(v_end)
        w_positive_grad = tf.matmul(tf.transpose(visibles), h_start)
        w_negative_grad = tf.matmul(tf.transpose(v_end), h_end)
        update_w = self.weights.assign_add(learning_rate * (w_positive_grad - w_negative_grad))
        update_vb = self.v_bias.assign_add(learning_rate * tf.reduce_mean(visibles - v_end, 0))
        update_hb = self.h_bias.assign_add(learning_rate * tf.reduce_mean(h_start - h_end, 0))
        return [update_w, update_vb, update_hb]

    def reconstruction_error(self, dataset):
        err = tf.stop_gradient(dataset - self.gibbs_vhv(dataset)[1])
        return tf.reduce_sum(err * err)

rbm_MNIST_test.py

import tensorflow as tf
import numpy as np
import rbm
import input_data

def build_model(X, w1, b1, wo, bo):
    h1 = tf.nn.sigmoid(tf.matmul(X, w1)+b1)
    model = tf.nn.sigmoid(tf.matmul(h1, wo)+bo)
    return model

def init_weight(shape):
    return tf.Variable(tf.random_normal(shape, mean=0.0, stddev=0.01))

def init_bias(dim):
    return tf.Variable(tf.zeros([dim]))

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
trX, trY, teX, teY = mnist.train.images, mnist.train.labels, mnist.test.images, mnist.test.labels

X = tf.placeholder("float", [None, 784])
Y = tf.placeholder("float", [None, 10])

rbm_layer = rbm.RBM("mnist", 784, 500)

for i in range(10):
    print "RBM CD: ", i
    rbm_layer.cd1(trX)

rbm_w, rbm_vb, rbm_hb = rbm_layer.cd1(trX)


wo = init_weight([500,10])
bo = init_bias(10)
py_x = build_model(X, rbm_w, rbm_hb, wo, bo)

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(py_x, Y))
train_op = tf.train.GradientDescentOptimizer(0.05).minimize(cost)
predict_op = tf.argmax(py_x, 1)

sess = tf.Session()
init = tf.initialize_all_variables()
sess.run(init)

for i in range(10):
    for start, end in zip(range(0, len(trX), 128), range(128, len(trX), 128)):
        sess.run(train_op, feed_dict={X: trX[start:end], Y: trY[start:end]})
    print i, np.mean(np.argmax(teY, axis=1) ==
                     sess.run(predict_op, feed_dict={X: teX, Y: teY}))

但出现了错误：

文件 “/usr/local/lib/python2.7/dist-packages/tensorflow/python/framework/ops.py”，第 1626 行，在 as_graph_def 中 raise ValueError("GraphDef 不能大于 2GB。") ValueError: GraphDef 不能大于 2GB。

有人可以帮我解决这个问题吗？

TensorFlow 确实有 2GB 的限制GraphDefprotos，它源于协议缓冲区实现的限制。如果图中有很大的常数张量，您很快就会达到该限制。特别是，如果您使用same多次使用 numpy 数组，TensorFlow 会向您的图中添加多个常量张量。

就你而言，mnist.train.images由返回input_data.read_data_sets是一个具有形状的 numpy 浮点数组(55000, 784)，所以它是关于164 MB。您将该 numpy 数组传递给rbm_layer.cd1，并在该函数内部，每次使用visibles, 一个 TensorFlowConst节点是从 numpy 数组创建的。你用visibiles在 3 个地点，因此每次致电cd1图形大小增加了大约492 MB，这样你就很容易超过限制了。解决方案是创建一个 TensorFlow 常量并将该常量传递给cd1功能如下：

trX_constant = tf.constant(trX)
for i in range(10):
    print "RBM CD: ", i
    rbm_layer.cd1(trX_constant)

顺便说一句，我不确定你在上面的循环中的意图是什么。请注意，cd1函数只需添加assign_add节点到图，并且实际上不执行分配。如果您确实希望在训练时发生这些分配，您应该考虑通过控制依赖项将这些分配链接到最终的train_op node.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

使用张量流实现 RBM 的相关文章

如何使用 TensorFlow 设置 Udacity 深度学习课程的学习环境 (Windows)

相信很多对深度学习感兴趣的人都听说过这门课程 https www udacity com course deep learning ud730 https www udacity com course deep learning ud730
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k
Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
Keras 自定义损失函数：访问当前输入模式

在 Keras 带有 Tensorflow 后端中当前输入模式可用于我的自定义损失函数吗当前输入模式被定义为用于产生预测的输入向量例如请考虑以下情况 X train X test y train y test train test
在 Tensorflow 中运行 CNN 时训练和测试的奇怪值

我一直在尝试使用自己的数据来训练和评估卷积神经网络其中包含 200 个训练图像和 20 个测试图像我的完整脚本在这里在 Tensorflow 中使用我自己的数据运行卷积网络时出错 https stackoverflow com que
SciKit-Learn 的分解模块中未安装 LatentDirichletAllocation

我在 SciKit Learn 包中遇到了一些奇怪的问题 SciKit Learn 包内有分解模块其中应包含 LatentDirichletAllocation 函数请参阅此处的文档 https scikit learn org s
使用 anaconda3 python 3.5 安装 Tensorflow 出现“读取超时错误”

我正在尝试安装tensorflow gpu 使用python3 6和anaconda 3 我正在按照以下链接中的安装步骤进行操作https www tensorflow org install install windows https w
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
您必须为 MNIST 数据集的占位符张量“Placeholder”提供一个值，dtype float 和 shape [?,784]

这是我在 MNIST 数据集上测试量化的示例我正在使用以下代码测试我的模型 import tensorflow as tf from tensorflow examples tutorials mnist import input dat
Tensorflow：从 TFRecords 文件中提取图像和标签

我有一个 TFRecords 文件其中包含图像及其标签名称大小等我的目标是将标签和图像提取为 numpy 数组我执行以下操作来加载文件 def extract fn data record features Extract fea
Keras 中的 model.fit() 和 model.evaluate() 有什么区别？

我使用 Keras 和 TensorFlow 后端来训练 CNN 模型之间是什么model fit and model evaluate 我应该最好使用哪一种我在用model fit 截至目前我知道的用处model fit and m
tf.keras.utils.image_dataset_from_directory，但标签来自 csv？

请告诉我哪里出错了我正在研究 Kaggle 狗品种分类挑战我想尝试 one hot 编码与标签编码图像未在图像目录中拆分因此我无法将推断与 tf keras utils image dataset from directory
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的

随机推荐

由于 URI 无效而导致安装失败？仅在调试模式下安装？

安卓安装失败的可能原因有哪些无效的 URI this 指的是什么 URI 在什么情况下它是无效的它在调试模式下工作正常但我无法在调试模式之外安装它 Thanks 此错误可能指向许多不同的问题并且有许多不同的修复方法总结一下我收集到
将具有相同 ID 的多行（具有一些非字符串值）合并到 pandas 中的一个分隔行中

我有一个这样的数据集 ID Name 1 a 1 b 1 2 1 3 2 er 2 get 2 better 3 123 3 cold 3 warm 3 sweet 3 heat 我想将这些数据分组在一起以便使用分隔符将具有相同 id 的
将 URI 映射到 LINQ-to-SQL 中的字符串字段

我正在尝试使用 LINQ 将 URI 作为字符串存储在数据库中 Column Name Url DbType nvarchar 255 public Uri Url get return new Uri url set url value
如何从图片中获取经纬度信息

如何从设备或SD卡中的图片存储中获取经纬度信息我找到了这个问题的非常简单的解决方案所以我将其发布在这里以帮助像我一样有问题的朋友从图片中获取地理位置 Bundle bundle getIntent getExtras if null b
异常处理在 ASP.NET 中运行的应用程序块异常处理程序无法调用 Response.End()

使用 NET 3 5 ASP NET Enterprise Library 4 1 异常处理和日志记录块我编写了一个自定义异常处理程序来显示标准错误页面如下所示 ConfigurationElementType typeof Custo
根据最近的关键条件连接 Spark DataFrame

在 PySpark 中执行模糊连接的高效方法是什么我正在寻找社区对在最近的关键条件下加入大型 Spark DataFrame 的可扩展方法的看法请允许我通过一个有代表性的例子来说明这个问题假设我们有以下 Spark DataFrame
Capybara::ElementNotFound 的所有规格仅在 Travis 上

我正在使用 selenium capybara 和 rspec 进行测试我注意到所有测试都在本地通过但在 travis 上所有测试都失败并在每个规范上出现此错误 Capybara ElementNotFound 我不确定这里出了什么
Nhibernate - 使用没有关系的连接表进行查询

我想知道是否有人尝试在 NHibernate 中这样做我有下表简化版本城市城市 varchar2 PK 省份 varchar2 PK 城市 TL 城市 varchar2 PK 省份 varchar2 PK 郎字符 2 PK 地点
显式禁用 REST 服务的缓存

我要申请Cache Control must revalidate no cache no store来自后端 REST 服务的所有响应我对此有两个问题这样做常见吗出于某种原因我的印象是没有必要但我还没有任何消息来源支持这一说法
如何使用 PyArg_ParseTupleAndKeywords 来解析具有可选参数和关键字的元组？

我到处都找过但找不到例子PyArg ParseTupleAndKeywords 与元组一起使用包含可选参数 and关键词我发现的最接近的是这个问题 https stackoverflow com questions 10625865
SQL Server 中使用另一个表的内容进行字符串替换（例如 update table1 set value = Replace(table1.value, table2.val1, table2.val2)）

我有一个包含邮政地址的 SQL Server 表在准备邮寄时我需要进行多次字符串替换以符合 USPS 偏好例如 Avenue 变为 Ave 为了省去枚举所有替换的麻烦我将标签缩写对保存在两列表中是否有一种优雅的方法可以将每个参数
类的operator()或将函数绑定为函子？

有两种方法可以创建函子保存状态的函数绑定一个函数并定义一个状态 bind f 1 state 双g 双x 双状态返回x 状态函数 f 绑定 g 1 状态 use 运算符和类 struct f double state f doubl
在node.js中使用mssql关闭MSSQL连接

我正在尝试在 node js 中编写一个脚本来查询 MSSQL 数据库我是 javascript 新手 node js 新手 VSCode 新手但我了解一些有关 SQL 的知识我有工作代码但连接似乎永远不会关闭并且我无法获取函数的
从任意多元函数中有效采样

我想从 Python 中的任意函数中采样 In 快速任意分布随机抽样 https stackoverflow com questions 21100716 fast arbitrary distribution random samplin
无法解决目标“android-18”错误

我无法下载目标 android 18 文件在 default properties 文件中 set target android 18 还要检查您是否安装了此 API 级别并在属性窗口中检查它例如在我的例子中选择了 17
制作不与顶部重叠的固定顶栏的最佳方法是什么？

例如 stackoverflow 有一个供新成员使用的顶栏顶栏是固定的向下推页面而不与页面顶部重叠这是如何实现的 JavaScript 或者只用 css 就可以做到这一点您可以执行以下操作来创建固定标头 div class head
如何修复 SQL Server 中阿拉伯文与英文混合的反向字符

我有一个 SQL Server 数据库表列在同一字段中包含阿拉伯语和英语字符就像Oracle 寻求您的帮助将阿拉伯字符与英文字符分开以反转它们因为阿拉伯字符在字段中没有特定的位置开始结束或中间 Edit这些字符来自旧版 IBM
Angularjs 表单验证顺序

我有一个简单的 html 表单其中包含常规文本输入 ng minlength ng maxlength and ng pattern有角的内置表单输入指令 http docs angularjs org api ng directive
#的目的是什么！在网址中[重复]

这个问题在这里已经有答案了可能的重复 Facebook 和新 Twitter URL 中的 shebang 有何用途 https stackoverflow com questions 3009380 whats the shebang
使用张量流实现 RBM

我正在尝试用tensorflow实现RBM 代码如下 rbm py An rbm implementation for TensorFlow based closely on the one in Theano import tensorf

使用张量流实现 RBM

使用张量流实现 RBM 的相关文章

随机推荐

热门标签