创建可训练权重的 Keras 层

2024-02-22

edit请参阅底部以了解我如何解决此问题

我写了自己的Keras层，其构建方法如下：

class Multed_Weights(Layer):

def __init__(self, input_dim, output_dim, **kwargs):
    self.output_dim = output_dim
    self.input_dim = input_dim

    super(Multed_Weights, self).__init__(**kwargs)

def build(self, input_shape):
    # Create a trainable weight variable for this layer.
    self.kernel = self.add_weight(name='kernel',
                                  shape=(self.input_dim, self.output_dim),
                                  initializer=RandomNormal(mean=0., stddev = 0.05, seed = None),
                                  trainable=True)
    super(Multed_Weights, self).build(input_shape)  # Be sure to call this somewhere!
    print("mult kernel has shape " + str(K.int_shape(self.kernel)))

def call(self, x, **kwargs):
    return Dot(axes = [1,0])([x, self.kernel])

def compute_output_shape(self, input_shape):
    output_shape = (None, self.output_dim)
    print("the output shape of multed weights is "+ str(output_shape))
    return output_shape

这就是我正在尝试做的事情。下列的https://arxiv.org/pdf/1503.08895.pdf https://arxiv.org/pdf/1503.08895.pdf（参见第 2 页上面的引文 (3)）我解决了之前的问题，但现在我遇到了另一个问题。

“InvalidArgumentError（请参阅上面的回溯）：不兼容的形状：[150,128] 与 [150,10000] [[节点：训练/SGD/gradients/multed__weights_1/dot_2/Mul_grad/BroadcastGradientArgs = BroadcastGradientArgs[T=DT_INT32, _class=["loc:@multed__weights_1/dot_2/Mul"], _device="/job:localhost/replica:0 /任务：0/设备：CPU：0“]（训练/SGD/梯度/multed__weights_1/dot_2/Mul_grad/形状，训练/SGD/梯度/multed__weights_1/dot_2/Mul_grad/Shape_1）]]”

所以问题仍然是这个类造成的。我的批量大小是 128，所以看来错误来自这个没有批量大小的权重矩阵。但它不允许我用 shape=(None, ... , ...) 创建它，所以我不知道该怎么做。

update我太关注这一层的动态批量大小。一旦我将形状硬编码为 (128, self.input_dim, self.output_dim)，提前知道我的批量大小是 128，它就工作得很好。尽管如此，我意识到这个方法在 128 个批次中的每一个批次中都会有不同的权重，所以也许我应该像以前一样设置形状，然后执行 RepeatVector 128 次。我怀疑 128 个中的每一个都会包含对相同权重的引用，而不是创建新的权重，但我不确定。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

创建可训练权重的 Keras 层的相关文章

tf.data.Dataset 迭代器返回 Tensor("IteratorGetNext:1", shape=(None, 16), dtype=int32) 但无法获取张量的值

我正在尝试编写一个自定义模型其中我正在编写一个自定义train step功能我正在从自定义数据生成器创建 tf data Dataset 例如 tds tf data Dataset from generator tdg iter ar
如何在 SQL Server 2000 中传递大于 varchar(8000) 的字符串参数？

如果将字符串参数定义为大小大于 8000 则会出现编译错误 e g The size 9000 given to the type varchar exceeds the maximum allowed for any data type
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
params 具有默认参数值的参数[重复]

这个问题在这里已经有答案了我见过params参数的次数比我能说的还要多并且总是删除它而不考虑它的含义现在我已经了解了它的目的我刚刚了解到的是params参数必须是参数列表中的最后一个但这是我对指定默认值的参数的了解例子 MyMe
Keras 导入错误 Nadam

我在尝试导入 Keras 模块 Nadam 时遇到导入错误 gt gt gt from keras optimizers import Nadam Traceback most recent call last File
Caffe，在层中设置自定义权重

I have a network In one place I want to use concat As on this picture 不幸的是该网络无法训练为了理解为什么我想连续改变权重这意味着 FC4096 中的所有值一开始都
升压参数库

最近我发现参数 http www boost org doc libs 1 50 0 libs parameter doc html index htmlBoost 中的库老实说我不明白为什么这是 Boost 的一部分当需要向函数传递
无效参数：indices[0,0] = -4 不在 [0, 40405) 中

我有一个模型可以处理一些数据我在数据集中添加了一些标记化的单词数据为简洁起见有些被截断 vocab size len tokenizer word index 1 comment texts df comment text values
应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
是否可以使用 params 通过使用yield 的函数通过 ref 传递变量

如果我有一个方法params参数是否可以通过引用传递并在每次调用yield 时更新像这样的事情 public static void GetRowsIter ref params valuesToUpdate foreach row i
sklearn pipeline + keras顺序模型-如何获取历史记录？

Keras https keras io模型当 fit被调用时返回一个历史对象如果我将此模型用作 sklearn 管道的一步是否可以检索它顺便说一句我正在使用 python 3 6 提前致谢 History 回调记录每个时期的训
使用 theano 进行多处理

我正在尝试将 theano 与 cpu 多处理和神经网络库 Keras 结合使用 I use device gpu标记并加载 keras 模型然后为了提取超过一百万张图像的特征我使用多处理池该函数看起来像这样 from keras
为什么 get_tensor_by_name 无法正确获取 tf.keras.layers 定义的层的权重

我尝试获取由以下定义的层的权重tf keras layers通过使用get tensor by name in tensorflow 代码如下 encoding utf 8 import tensorflow as tf x tf plac
输入维度/分辨率会影响卷积神经网络的性能吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在构建一个图像分类器其中有 66 个类和大约 50000 个图像我的电脑内存为 12 GB 我的内存不足以训练图像我的问题是
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
Keras 中的损失函数和度量有什么区别？ [复制]

这个问题在这里已经有答案了我不清楚 Keras 中损失函数和指标之间的区别该文档对我没有帮助损失函数用于优化您的模型这是优化器将最小化的函数指标用于判断模型的性能这仅供您查看与优化过程无关
带有泛型类声明的命名空间约束

我想知道是否如果可以的话如何可以将命名空间定义为泛型类声明中的约束参数我所拥有的是这样的 namespaceMyProject Models Entities namespaceMyProject Tests BaseTest 现在我
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res

随机推荐

通过 API 迭代 mailchimp 模板中的集合

是否有机会通过 API 填写可重复的部分例如我有产品列表我只想在模板中包含一次产品部分然后迭代集合我已经阅读了之前关于该主题的讨论并进行了谷歌搜索但我仍然不明白是否可以通过 API 实现 div h2 Title h2 p Bo
在 Windows（Vista 和 XP）上安装 Exuberant Ctags

我想在工作时在 Vista 也可能是 XP 笔记本电脑上使用 Exuberant Ctags 关于操作系统没有选择我使用 GVim 而不是我的同事推荐的 Flex Builder 因为 FB 有问题并且无论如何也不能做 GVim 所做的
是否有一个 create() 供 vuex 操作自动调度

我在 vuex 中有一个操作我想在 vuex 本身而不是组件中自动调度我创建了一个通知栏它通过多个页面上的不同通知进行更改当我切换页面时通知不是从头开始而是创建了一个商店来设置要显示的通知我想从 vuex 内部而不是从组件内部
ICU自定义音译

我希望利用 ICU 库进行音译但我想为一组特定的自定义音译提供自定义音译文件以便在编译时合并到 ICU 核心中以便在其他地方以二进制形式使用出于兼容性原因我正在使用 ICU 4 2 的源代码据我了解从他们网站的 ICU 数据页
理解 scala：柯里化

我最近开始学习 Scala 并遇到了柯里化从这个答案post https stackoverflow com questions 17768686 currying example in scala 这段代码片段 def sum a In
MVC 3：如何学习如何使用 NUnit、Ninject 和 Moq 进行测试？

我的问题的简短版本任何人都可以向我指出一些好的详细的资料来源吗可以学习如何在我的 MVC 3 应用程序中实现测试使用 NUnit Ninject 2 和起订量这里有人可以帮助我澄清控制器存储库如何解耦模拟和依赖注入一起工作吗
在首页以外的其他页面中显示图像时出现问题（wordpress/html/css）

您好我有一个正在为客户做的小网站我使用了 html css 网站并使用空白主题将其转移到 WordPress 到目前为止一切顺利如果您愿意请查看 energyshop se 在起始页中显示了顶部的两个图像但没有显示其余选项卡为什
firestore 权限缺失或不足

我收到错误 Firebase 缺少或权限不足代码 const demoCollectionRef this db collection items 返回 demoCollectionRef add item 我认为这个错误是由于 angu
Android Studio 3.0.1 上的 Gradle 项目同步失败

我是第一次在笔记本电脑上安装 Android Studio 3 0 1 但无法创建我的第一个 Hello World 应用程序我收到以下错误 Create process failed error 216 Error Consult yo
div 下面仍然触发 click 事件

这是我正在构建的 PhoneGap 应用程序我正在我的笔记本电脑上进行测试然后使用 PhoneGap cli 在 iPhone 上进行测试我有一个 openlayers 3 地图上面记录了点击事件我还有一个 div 当菜单显示时
在 Android 中显示撰写短信视图

我想用 Android 发送短信发送短信的目的是什么我想显示撰写短信视图并在消息字段中传递我的预定义文本您可以使用以下代码 startActivity new Intent Intent ACTION VIEW Uri parse
自动从网页中提取提要链接（atom、rss等）[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个巨大的 URL 列表我的任务是将它们提供给一个 python 脚本该脚本应该吐出提要 UR
Android：当软输入键盘出现时，Recyclerview 不会调整大小

我有一个包含片段的活动并且该片段包含自定义视图自定义视图包含一个编辑文本其正下方是一个高度为 match parent 的回收视图当用户将焦点放在编辑文本上时会出现一个软输入键盘不幸的是该键盘隐藏了其下方一半的回收视图我希望
如何从mysql表中获取自增字段名或主键字段名？

在PHP中如何获取已设置为在添加新记录时自动递增的字段的字段名称在大多数情况下它与表的 PRIMARY KEY 相同但不一定总是如此所以这个问题有两部分第二部分分支为第三部分 1 如何获取自增字段名称 2 如何获取primary
Android Gradle 支持库必须使用相同版本

我已经查看了所有其他问题并用谷歌搜索了不可能的问题但我找不到使用正确依赖项的方法下面是我的应用程序 Gradle 构建文件 buildscript repositories google jcenter dependencies cla
从解决方案中删除 TFS 连接

如何将解决方案制作为干净副本而不映射到 TFS 问题是当我尝试打开它时会显示此消息我想在没有 TFS 连接的情况下正常打开它要完全删除 TFS 源代码管理绑定请执行以下两个步骤转到解决方案的文件夹查找并删除所有文件 vssscc
由于 libssl 依赖，`apt-get install librdkafka1` 在 Debian 9.x 上失败

Basic apt get install librdkafka1在 Debian 8 x 上工作但在 Debian 9 x 上失败这看起来像是关于 libssl 的依赖版本问题 Debian 8 x 有 libssl1 0 0 Deb
为什么需要 islower() 及其朋友来处理 EOF？

Why are islower 以及需要处理的朋友EOF 然而putchar 朋友们不需要吗为什么不是islower 治疗int as unsigned char 就像情况一样putchar 这是完全有道理的因为我们必须检查EOF无论如
libstdc++.so.6：找不到版本“GLIBCXX_3.4.20”

为了将 gt 2GB 的原始读数上传到 Genebank 上的 SRA 我在 ubuntu 16 04 上安装了 aspera connect 插件但按照基因库 SRA 门户上的说明该插件并未弹出当我在本地初始化插件时我在终端上收到
创建可训练权重的 Keras 层

edit请参阅底部以了解我如何解决此问题我写了自己的Keras层其构建方法如下 class Multed Weights Layer def init self input dim output dim kwargs self outp

创建可训练权重的 Keras 层

创建可训练权重的 Keras 层 的相关文章

随机推荐

热门标签

创建可训练权重的 Keras 层的相关文章