嵌入层 Keras 的可变长度输入

2024-01-15

我有一个可变大小的文本语料库。我正在尝试使用 keras 中的嵌入层将文本输入 LSTM 模型。我的代码看起来像这样：

import numpy as np
from keras.layers import Embedding, Input, LSTM, RNN, SimpleRNN
from keras.models import Model, Sequential


vocab_size = 20000
embedding_len = 50

model = Sequential()
model.add(Embedding(vocab_size, embedding_len))

我使用 numpy 随机数生成器生成了一个示例输入：

akak=[]
for i in range(10):
    akak.append(np.random.randint(0, 20, size = (np.random.randint(1,30, size=None))))
input_array = np.asarray(akak)
print(input_array)

Output:

array([array([16,  2,  9, 12, 18, 10, 10, 14,  3, 11,  4,  6,  8, 11,  3]),
       array([ 3,  6,  5,  8,  3, 10, 19,  9, 17]),
       array([ 1,  6, 17, 14, 14, 19, 12, 15, 14,  0, 16,  2,  1, 18, 13, 14, 17,
       14,  2, 11,  0, 19,  2,  8, 13, 10, 17, 13,  5]),
       array([ 5, 10, 18,  0,  4,  8]),
       array([ 5, 14, 19, 16, 10,  8, 13,  8, 12,  5, 19]),
       array([ 7,  4, 17,  0, 10,  8,  3,  6, 14,  4,  8,  9,  0]),
       array([ 4,  7,  7, 16,  7,  6, 16,  9,  4,  2, 11]),
       array([ 2, 16, 15, 16, 18, 11,  7,  1,  0,  5, 11, 12, 11,  8,  3,  8,  8,
       16, 19,  8]),
       array([12, 18, 19, 15, 11,  6, 16, 16,  2, 12,  0, 14, 16,  0]),
       array([12, 13, 13])], dtype=object)

当我尝试预测仅使用嵌入时model.predict(input_array)，我收到以下错误

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-49-313059fadb55> in <module>()
----> 1 model.predict(input_array).shape

/home/biswadip/.local/lib/python3.6/site-packages/keras/engine/training.py in predict(self, x, batch_size, verbose, steps)
   1167                                             batch_size=batch_size,
   1168                                             verbose=verbose,
-> 1169                                             steps=steps)
   1170 
   1171     def train_on_batch(self, x, y,

/home/biswadip/.local/lib/python3.6/site-packages/keras/engine/training_arrays.py in predict_loop(model, f, ins, batch_size, verbose, steps)
    292                 ins_batch[i] = ins_batch[i].toarray()
    293 
--> 294             batch_outs = f(ins_batch)
    295             batch_outs = to_list(batch_outs)
    296             if batch_index == 0:

/home/biswadip/.local/lib/python3.6/site-packages/keras/backend/tensorflow_backend.py in __call__(self, inputs)
   2713                 return self._legacy_call(inputs)
   2714 
-> 2715             return self._call(inputs)
   2716         else:
   2717             if py_any(is_tensor(x) for x in inputs):

/home/biswadip/.local/lib/python3.6/site-packages/keras/backend/tensorflow_backend.py in _call(self, inputs)
   2653                 array_vals.append(
   2654                     np.asarray(value,
-> 2655                                dtype=tf.as_dtype(tensor.dtype).as_numpy_dtype))
   2656         if self.feed_dict:
   2657             for key in sorted(self.feed_dict.keys()):

/home/biswadip/.local/lib/python3.6/site-packages/numpy/core/numeric.py in asarray(a, dtype, order)
    536 
    537     """
--> 538     return array(a, dtype, copy=False, order=order)
    539 
    540 

ValueError: setting an array element with a sequence.

我知道我可以只填充序列，但 LSTM 层不会只返回填充序列的最后一个隐藏状态。我想要来自实际序列的最后一个隐藏状态的隐藏状态，而不是填充的隐藏状态，即如果我的序列长度是 15 并且最大序列长度是 200，我想要来自第 15 个状态而不是第 200 个状态的隐藏状态向量

来自keras文档 https://keras.io/api/layers/core_layers/embedding/我们为嵌入层获得了这个非常有用的参数：

掩码零：布尔值，输入值 0 是否是应屏蔽掉的特殊“填充”值。当使用可能采用可变长度输入的循环层时，这非常有用。如果这是 True，则模型中的所有后续层都需要支持屏蔽，否则将引发异常。如果 mask_zero 设置为 True，则索引 0 不能在词汇表中使用（input_dim 应等于词汇表大小 + 1）。

这意味着，无论如何我们都应该填充序列，但将此参数设置为 True，以便序列可以用作 RNN 的可变长度序列。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Keras

LSTM

Embedding

wordembedding

嵌入层 Keras 的可变长度输入的相关文章

如何在python 3.7中生成条形码

我正在使用 python 3 7 为了生成条形码我尝试使用安装 pyBarcode 库pip install pyBarcode 但它显示以下错误找不到满足 pyBarcode 要求的版本来自版本找不到 pyBarcode 的匹配分
如何以“正确”的方式处理带有空字节的 Python unicode 字符串？

Question PyWin32 似乎很乐意将 null 终止的 unicode 字符串作为返回值我想以正确的方式处理这些字符串假设我得到一个像这样的字符串 u C Users Guest MyFile asy x00 x00sy
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
如何检查python xlrd库中的excel文件是否有效

有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件我知道还有其他库可以检查文件头我可以使用文件扩展名检查但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
Kivy - 有所有颜色名称的列表吗？

在 Kivy 中小部件 color属性允许输入其值作为字符串颜色名称也例如在 kv file Label color red 是否有所有可能的颜色名称的列表就在这里来自Kivy 的文档 https kivy org doc sta
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
如果未引发异常，则通过 Python 单元测试

在Python中unittest框架是否有一种方法可以在未引发异常的情况下通过单元测试否则会因 AssertRaise 而失败如果我正确理解你的问题你could做这样的事情 def test does not raise on va
在没有模型的情况下将自定义页面添加到 django admin

我正在尝试在没有模型关联的情况下向管理员添加自定义页面这就是我迄今为止所取得的成就 class MyCustomAdmin AdminSite def get urls self from django conf urls import
搜索多个字段

我想我没有正确理解 django haystack 我有一个包含多个字段的数据模型我希望搜索其中两个字段 class UserProfile models Model user models ForeignKey User unique
没有名为 StringIO 的模块

我有Python 3 6 我想从另一个名为 run py 的 python 文件执行名为 operation py 的 python 文件 In operation py I do from cStringIO import StringI
结构差异 sudo() run('sudo 命令')

我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的除了它总是换行调用 sudo 程序中的给定命令以提供超级用户特权但有几次 sudo cmd 提示我输入
Django 的 request.FILES 出现 UnicodeDecodeError

我在视图调用中有以下代码 def view request body u for filename f in request FILES items body body Filename filename n f read n 在某些情况下
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
Elasticsearch 通过搜索返回拼音标记

我用语音分析插件 https www elastic co guide en elasticsearch plugins current analysis phonetic html由于语音转换从弹性搜索中进行一些字符串匹配我的问题是
混淆矩阵不支持多标签指示符

multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
如何与其他用户一起使用 pyenv？

如何与其他用户一起使用 pyenv 例如如果我在用户 test 的环境中安装了 pyenv 则当我以 test 身份登录时可以使用 pyenv 但是当我以其他用户例如 root 身份登录时如何使用 pyenv 即使你这么做了我也会s
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练
Apache Beam Pipeline 写表后查询表

我有一个 Apache Beam Dataflow 管道它将结果写入 BigQuery 表然后我想查询该表以获取管道的单独部分但是我似乎无法弄清楚如何正确设置此管道依赖性我编写的新表然后想要查询与一个单独的表连接以进行某些过滤

随机推荐

以编程方式阻止 Windows 关闭

我想阻止视窗XP只要我的Delphi应用程序正在运行我尝试了以下操作 procedure TForm1 FormCreate Sender TObject begin SystemParametersInfo SPI SETSCREENS
SQL Server - 是否可以找到 MDF 或 LDF 文件中实际使用的大小

当添加一个 MDF NDF or LDF将文件保存到 SQL Server 后我们可以选择设置其初始大小自动增长和增量百分比或绝对数据库运行一段时间后是否可以发现数据占用了实际大小的多少例如如果文件的实际大小为5M 但仅使用2
如果攻击者获得了应用程序的client_secret，他可以做什么？

我在网上搜索了很多但没有用我想知道如果攻击者获得 Google Oauth2 应用程序的 client id 和 client secret 可以做什么比如他能看到什么信息他可以编辑应用程序配置吗他能看到别人的信息吗我以前没有使用
JavaScript 中如何 [1,2] + [4,5,6][1] = 1,25 [重复]

这个问题在这里已经有答案了我在采访中得到了这个问题 1 2 4 5 6 1 JavaScript 给出答案1 25 这是怎么回事请解释清楚让我们从最后一部分开始写得更详细一些 var arr 4 5 6 var value arr
如何在 React Native 中创建功能齐全的帮助文件？

尽管有一个类似的问题但我无法创建具有多个功能的文件不确定该方法是否已经过时因为 RN 发展得非常快如何在本机反应中创建全局辅助函数 https stackoverflow com questions 33539774 how to
IntelliJ下Spring Boot热部署模板和资源

有谁知道在 IntelliJ 14 0 2 下为 Spring Boot 应用程序热部署资源和模板的机制我知道完整的 Spring Boot 支持计划在 14 1 发布但我有一个项目从标准 WAR 项目转换为 Spring Boot 项
在图像上淡出滚动 UITextView 吗？

我希望淡出滚动条UITextView在背景图像上类似于这个小例子顶部的渐变我正在尝试弄清楚如何使用来实现这一目标CAGradientLayer和面具当视图中的文本滚动垂直时我需要文本在到达视图框架之前变得透明以给人一种它向上和
Intl.NumberFormat 的指数表示法

我想知道是否有办法让我使用 JavascriptIntl NumberFormat https developer mozilla org en US docs Web JavaScript Reference Global Objects
如何获取firestore collectionGroup查询的父文档？

我正在尝试获取我得到的所有子集合查询的父文档因此我的数据库看起来像这样生产 id 位置 id positionhistory 我获得了职位历史的所有文件但我还需要一些职位和生产的数据我希望是否有一种方法可以在 collectionG
如何为水平回收视图制作页面指示器

知道如何为 recyclerview 列表创建页面指示器吗您可以使用 RecyclerView ItemDecoration 添加指示器只需在底部画一些直线或圆圈并使用layoutManager findFirstVisibleItem
我可以通过 iAds 和应用内购买来删除单个应用中的广告吗？

根据苹果广告指南 https developer apple com appstore resources approval guidelines html advertising https developer apple com app
如果
为空，背景图像不会出现？

我创建了一个 div 第一件事是在在页面顶部绘制顶线 div class bordertop div 和风格 body font family Helvetica Arial sans serif webkit text size adju
Rails 3：PDF 格式的guides.rubyonrails.org？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案在哪里可以找到 PDF 格式的 Rails 3 指南以供离线阅读 Thanks 您无法以 PDF 形式
pyside / pyqt：绑定共享相同功能的多个按钮的简单方法

我是 PyQt PySide 的新手我有很多行编辑用于显示文件位置并且对于每行文本我都有一个按钮用于显示打开文件对话框我有一个方法 def selectSelf1 self browse for file dialog myDi
AutoMapper 忽略子集合属性

我正在尝试映射具有子对象集合的相同类型的对象并且发现应用于子对象属性的 Ignore 似乎被嗯忽略了这是一个演示该问题的单元测试 class A public int Id get set public string Name get
UIScrollView 在所有模拟器上滚动，但在我的 iPhone 上不滚动

因此在弄清楚scrollView的工作原理之后我用以下代码实现了它 self scrollView delegate self self scrollView userInteractionEnabled YES CGRect view
在涉及 SslStream.AuthenticateAsClient() 的客户端证书期间设置“Windows 安全”对话框所有者

首先一些背景致电后SslStream AuthenticateAsClient https msdn microsoft com en us library ms145061 v vs 110 aspx要启动 TLS SSL 握手可以向
UE4.27中的景观创建

我正在尝试创造一个风景Python 虚幻 API https docs unrealengine com 4 26 en US PythonAPI using unreal EditorLevelLibrary spawn actor fr
如何在不复制 Xcode 4 项目的情况下从付费版本构建免费版本？

我听说有传言说通过使用目标和条件编译指令可以在不复制 Xcode 项目的情况下构建应用程序的不同变体例如 IF FREE VERSION self loadGreatFeature ELSE self loadBoringFeatur
嵌入层 Keras 的可变长度输入

我有一个可变大小的文本语料库我正在尝试使用 keras 中的嵌入层将文本输入 LSTM 模型我的代码看起来像这样 import numpy as np from keras layers import Embedding Input L

嵌入层 Keras 的可变长度输入

嵌入层 Keras 的可变长度输入 的相关文章

随机推荐

热门标签

嵌入层 Keras 的可变长度输入的相关文章