无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

2024-01-09

张量流keras中的层有一个方法build它用于将权重创建推迟到您了解输入内容的时间。图层的构建方法 https://www.tensorflow.org/api_docs/python/tf/keras/layers/Layer#build

我有几个问题无法找到答案：

here https://www.tensorflow.org/guide/keras/custom_layers_and_models#layers_are_recursively_composable据说

If you assign a Layer instance as attribute of another Layer, the outer layer will start tracking the weights of the inner layer.

跟踪层的权重意味着什么？

The same link also mentions that

我们建议在init方法（由于子层通常有一个构建方法，因此它们将在构建外层时构建）。

这是否意味着在运行时build子类（self）的方法，将迭代其所有属性self以及被发现是（的实例）的子类tf.keras.layer.Layer将会有他们的build方法自动运行？

我可以运行这段代码：

class Net(tf.keras.Model):
  """A simple linear model."""

  def __init__(self):
    super(Net, self).__init__()
    self.l1 = tf.keras.layers.Dense(5)
  def call(self, x):
    return self.l1(x)

net = Net()
print(net.variables)

但不是这个：

class Net(tf.keras.Model):
  """A simple linear model."""

  def __init__(self):
    super(Net, self).__init__()
    self.l1 = tf.keras.layers.Dense(5)
  def build(self,input_shape):
    super().build()
  def call(self, x):
    return self.l1(x)

net = Net()
print(net.variables)

why?

我会说build提到的意思是，当你构建一个自定义的 tf.keras.Model 时

net = Net()

那么你会得到所有tf.keras.layers.Layer对象创建于__init__，并存储在net这是一个可调用对象。这样的话就成为一个完成的对象供TF后面训练了，是这样说的to track。下次你打电话的时候net(inputs)你会得到你的输出。

下面是Tensorflow自定义解码器的例子，带attention

class BahdanauAttention(tf.keras.layers.Layer):
  def __init__(self, units):
    super(BahdanauAttention, self).__init__()
    self.W1 = tf.keras.layers.Dense(units)
    self.W2 = tf.keras.layers.Dense(units)
    self.V = tf.keras.layers.Dense(1)

  def call(self, query, values):
    # query hidden state shape == (batch_size, hidden size)
    # query_with_time_axis shape == (batch_size, 1, hidden size)
    # values shape == (batch_size, max_len, hidden size)
    # we are doing this to broadcast addition along the time axis to calculate the score
    query_with_time_axis = tf.expand_dims(query, 1)

    # score shape == (batch_size, max_length, 1)
    # we get 1 at the last axis because we are applying score to self.V
    # the shape of the tensor before applying self.V is (batch_size, max_length, units)
    score = self.V(tf.nn.tanh(
        self.W1(query_with_time_axis) + self.W2(values)))

    # attention_weights shape == (batch_size, max_length, 1)
    attention_weights = tf.nn.softmax(score, axis=1)

    # context_vector shape after sum == (batch_size, hidden_size)
    context_vector = attention_weights * values
    context_vector = tf.reduce_sum(context_vector, axis=1)

    return context_vector, attention_weights

class Decoder(tf.keras.Model):
  def __init__(self, vocab_size, embedding_dim, dec_units, batch_sz):
    super(Decoder, self).__init__()
    self.batch_sz = batch_sz
    self.dec_units = dec_units
    self.embedding = tf.keras.layers.Embedding(vocab_size, embedding_dim)
    self.gru = tf.keras.layers.GRU(self.dec_units,
                                   return_sequences=True,
                                   return_state=True,
                                   recurrent_initializer='glorot_uniform')
    self.fc = tf.keras.layers.Dense(vocab_size)

    # used for attention
    self.attention = BahdanauAttention(self.dec_units)

  def call(self, x, hidden, enc_output):
    # enc_output shape == (batch_size, max_length, hidden_size)
    context_vector, attention_weights = self.attention(hidden, enc_output)

    # x shape after passing through embedding == (batch_size, 1, embedding_dim)
    x = self.embedding(x)

    # x shape after concatenation == (batch_size, 1, embedding_dim + hidden_size)
    x = tf.concat([tf.expand_dims(context_vector, 1), x], axis=-1)

    # passing the concatenated vector to the GRU
    output, state = self.gru(x)

    # output shape == (batch_size * 1, hidden_size)
    output = tf.reshape(output, (-1, output.shape[2]))

    # output shape == (batch_size, vocab)
    x = self.fc(output)

    return x, state, attention_weights

我试过把tf.keras.layers.Layer对象在call并得到了非常糟糕的结果，我猜那是因为如果你把它放进去call那么每次发生前向后向传播时，它都会被多次调用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

Keras

tensorflow20

keraslayer

tfkeras

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）的相关文章

如何使用tensorFlow C++ API中的fileWrite摘要在Tensorboard中查看它

无论如何我是否可以获得与 FileWriter 相对应的张量名称以便我可以写出我的摘要以在 Tensorboard 中查看它们我的应用程序是基于C 的所以我必须使用C 来进行训练 FileWriter 不是张量 import ten
tensorflow：检查标量布尔张量是否为 True

我想使用占位符控制函数的执行但不断收到错误不允许使用 tf Tensor 作为 Python bool 这是产生此错误的代码 import tensorflow as tf def foo c if c print This is tr
TensorFlow 2.0：在自定义训练循环中显示进度条

我正在为音频分类任务训练 CNN 并且使用带有自定义训练循环的 TensorFlow 2 0 RC 如中所述本指南 https www tensorflow org beta guide keras training and evaluat
在c++中的嵌入式python中导入tensorflow时出错

我的问题是关于在 C 程序中嵌入 Python 3 5 解释器以从 C 接收图像并将其用作我训练的张量流模型的输入当我在 python 代码中导入tensorflow库时出现错误其他库工作正常简化后的代码如下 include
具有多个输入的kerasvalidation_data

我尝试使用validation data方法但是有问题 model fit X macd train X rsi train X ema train Y train sample weight sample weight validati
Learning_rate 不是合法参数

我正在尝试通过实现 GridSearchCV 来测试我的模型但我似乎无法在 GridSearch 中添加学习率和动量作为参数每当我尝试通过添加这些代码来执行代码时我都会收到错误这是我创建的模型 def define model op
稍微不同的形状会收敛到错误的数字 - 为什么？

我试图弄清楚为什么 TensorFlow 会做一些令人惊讶的事情我将其归结为一个测试用例尝试对一个简单的问题进行线性回归该问题只需将两个输入加在一起权重收敛到 1 0 偏差收敛到 0 0 正如它们应该的那样使用此版本的训练输出 t
不确定我的自动编码器神经网络从 Keras 预测中给出的结果

我正在尝试构建一个自动编码器神经网络用于在单列文本列表中查找异常值我的输入有 138 行它们看起来像这样 amaze header 2 png amaze header png circle shape xml disableable
提交用于 Tensorflow 对象检测的 Google Cloud ML 训练作业时出现错误消息

尝试提交 Tensorflow 对象检测任务的 Google Cloud ML 训练作业我正在遵循官方指南 https github com tensorflow models blob master research object de
如何在google colaboratory上使用GPU升级tensorflow

目前google colaboratory使用tensorflow 1 4 1 我想升级到1 5 0版本每次当我执行时 pip install upgrade tensorflow命令 notebook实例成功将tensorflow版本升
如何在张量流中使用索引数组？

如果给定一个矩阵a有形状 5 3 和索引数组b有形状 5 我们很容易得到对应的向量c通过 c a np arange 5 b 但是我不能用张量流做同样的事情 a tf placeholder tf float32 shape 5 3 b
查找张量流运算所依赖的所有变量

有没有办法找到给定操作通常是损失所依赖的所有变量我想用它来将该集合传递到optimizer minimize or tf gradients 使用各种set intersection 组合到目前为止我已经找到了op op input
Tensorflow：无法在 gradle 中解析

今天早上我打开 Android Studio 时 Gradle 尝试同步时出现以下错误 Error 103 13 Failed to resolve org tensorflow tensorflow android 按照他们的说明Gith
Tensorflow - 获取队列中的样本数量？

对于性能监控我想关注当前排队的示例我正在平衡用于填充队列的线程数量和队列的最佳最大大小我如何获得这些信息我正在使用一个tf train batch 但我猜这些信息可能在下面的某个地方FIFOQueue 我本以为这是一个局部变量但我
mac安装Tensorflow出错

我正在尝试使用以下说明在 mac 中安装 Tensorflow https www tensorflow org install https www tensorflow org install 但是当我想导入tensorflow时我总是
使用 keras 澄清 Yolo v3 模型输出

我将 yolo v3 模型与 keras 一起使用该网络为我提供了形状如下的输出容器 1 13 13 255 1 26 26 255 1 52 52 255 所以我找到了这个link https www cyberailab com ho
使用张量流导出神经网络的权重

我使用张量流工具编写了神经网络一切正常现在我想导出神经网络的最终权重以制定单一的预测方法我怎样才能做到这一点您需要在训练结束时使用以下命令保存模型tf train Saver https www tensorflow org ver
在基本 Tensorflow 2.0 中运行简单回归

我正在学习 Tensorflow 2 0 我认为在 Tensorflow 中实现最基本的简单线性回归是一个好主意不幸的是我遇到了几个问题我想知道这里是否有人可以提供帮助考虑以下设置 import tensorflow as tf 2
Scipy 稀疏 CSR 矩阵到 TensorFlow SparseTensor - 小批量梯度下降

我有一个 Scipy 稀疏 CSR 矩阵它是根据 SVM Light 格式的稀疏 TF IDF 特征矩阵创建的特征数量巨大且稀疏所以我必须使用 SparseTensor 否则速度太慢例如特征数量为 5 示例文件如下所示 0 4 1
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf

随机推荐

Ho 在混合应用程序（主要语言 ObjC）中从 Swift 获取对 appdelegate 的引用以避免引用循环

首先我知道这一点如何获取 Swift 中应用程序委托的引用 https stackoverflow com questions 24046164 how do i get a reference to the app delegate i
如何在Python中按顺时针/逆时针方向对点列表进行排序？

我得到了坐标点列表我想按顺时针逆时针对它们进行排序这是我提到的清单 985 268 112 316 998 448 1018 453 1279 577 1196 477 1161 443 986 0 830 0 983 230 998
MYSQL使用count(*)进行选择查询

我有一个关于 MYSQL 中的选择查询的问题我有两个不同的表我想获得某个结果我使用了 COUNT 方法它只给了我结果 gt 1 但实际上我想使用包含零的所有计数该怎么做我的查询是 SELECT first subscriber
什么时候一个对象适合垃圾收集器？

考虑这个示例代码 1 public class GC 2 private Object o 3 private void doSomethingElse Object obj o obj 4 public void doSomething
声明终止。在语句完成之前最大递归 100 已用完

设置表和示例数据 USE LDS GO Object Table dbo Table DownLineList Script Date 11 14 2013 11 45 31 SET ANSI NULLS ON GO SET QUOTED
UIImage imageNamed 不适用于 ios 5.0

我使用这段代码图像集图像 UIImage imageNamed 电子邮件受保护 cdn cgi l email protection 它适用于 ios 4 3 但在 ios 5 0 上我看不到我的图像有谁知道这个问题属于哪一类您通常不
DataGridView - 父子数据库关系 - 更新子 DataGridView 数据

有人愿意帮助我完成以下事项吗我有两个 DataGridView 对象每个对象显示一个 DataTable 其中两个数据表与以下代码相关 DataSet dSet new DataSet DataTable ParentList List
找不到 uri [//<type>/] 和方法 [PUT] 的处理程序

我正在尝试使用插入文档 api 的自动增量 id 功能向我的 elasticsearch 索引发出原始 NodeJS http 请求所以这适用于curl curl XPOST http host 3333 catalog products
JavaScript 中的土耳其语大小写转换

我想在我想要的语言环境中将 JavaScript 中的字符串转换为小写或大写我认为标准功能就像toUpperCase and toLocaleUpperCase 不能满足这个需要 toLocale函数没有按其应有的方式运行例如在我的系
无法解析远程名称

我正在为 Windows Mobile 6 创建移动应用程序我正在 url 网站上上传图像为此我使用 webrequest 和 webresponse 类在获得响应时我收到此类错误无法解析远程名称我的代码是字符串网址 htt
在 lucene BooleanQuery 中将整个句子与空格匹配

我有一个搜索字符串 Tulip INN Riyadhh Tulip INN Riyadhh LUXURY Suites of Tulip INN RIYAHdhh 如果我提到的话我需要搜索词 Tulip INN Riyadhh 它必须返回
获取页面墙上其他人的帖子（Facebook API）

我四处寻找但找不到答案所以我在这里尝试是否可以在页面墙上获取其他人的帖子参见图片作为示例 http d pr i fklT http d pr i fklT 通过 Facebook 的 API 我尝试过使用 PAGE ID post
如何在没有输出的情况下打开 IPython 笔记本？

我有一个 IPython 笔记本我不小心转储了一个巨大的输出 15 MB 导致笔记本崩溃现在当我打开笔记本并尝试删除有问题的单元格时笔记本再次崩溃从而使我无法解决问题并使笔记本恢复稳定我能想到的最好的解决方法是将输入单元手动粘贴
Spark.eventLog.dir和spark.history.fs.logDirectory有什么区别？

Spark中事件日志目录和历史服务器日志目录有什么区别 spark eventLog dir hdfs var log spark apps spark history fs logDirectory hdfs var log spark
Heroku 上的 Spring Boot Gradle 应用程序：无法访问 jarfile

我有一个 spring boot gradle 应用程序可以通过执行以下操作在我的 PC 上成功运行 heroku local 当我去的时候它也可以成功部署在heroku上 git push heroku master 这是我的结果 Co
Java socket编程中如何实现客户端与服务器的持续交互

Java Socket 编程中如何实现客户端与服务器的持续交互在我的程序中我的目录中有许多文件夹即 F read 我正在将包含文件的文件夹从客户端传输到服务器当第一次请求时一个文件夹从客户端传输到服务器当再次向客户端发送另一个文
SplitAt 3 然后继续分裂

我想在 Haskell 中每 3 个字母分割一个字符串我尝试过使用splitAt但我必须重复此操作直到字符串每 3 个字母被分割一次有没有办法做到这一点 E g WEAREDISCOVERED 会成为 WEA RED ISC OVE
将字符串拆分为交替的单词（Scala）

我想将一个字符串分割成交替的单词总会有一个偶数 e g val text this here is a test sentence 应该转换为某种有序集合类型其中包含 this is test and here a sentence 我
numpy 中的局部均值滤波器

我有一个 512x512x512 numpy 数组是否有任何有效的方法来执行均值过滤器其中每个数组值都被所有 3x3x3 本地值替换我们正在寻找类似的东西scipy ndimage filters median filter但用平均值
无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

张量流keras中的层有一个方法build它用于将权重创建推迟到您了解输入内容的时间图层的构建方法 https www tensorflow org api docs python tf keras layers Layer build

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer） 的相关文章

随机推荐

热门标签

无法理解tensorflow keras层中“build”方法的行为（tf.keras.layers.Layer）的相关文章