如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

2024-05-04

我有以下想法要实施：

                       Input -> CNN-> LSTM -> Dense -> Output

输入有 100 个时间步长，每个步长有一个 64 维特征向量

A Conv1D层将在每个时间步提取特征。 CNN 层包含 64 个滤波器，每个滤波器的长度为 16 个抽头。然后，maxpooling 层将提取每个卷积输出的单个最大值，因此每个时间步总共将提取 64 个特征。

那么CNN层的输出将是馈入 LSTM 层有 64 个神经元。递归次数与输入的时间步长相同，即 100 个时间步长。 LSTM层应该返回一个64维输出的序列（序列的长度==时间步数==100，所以应该有100*64=6400个数字）。

input = Input(shape=(100,64), dtype='float', name='mfcc_input')
CNN_out = TimeDistributed(Conv1D(64, 16, activation='relu'))(mfcc_input)
CNN_out = BatchNormalization(axis=-1, momentum=0.99, epsilon=0.001, center=True, scale=True)(CNN_out)
CNN_out = TimeDistributed(MaxPooling1D(pool_size=(64-16+1), strides=None, padding='valid'))(CNN_out)

LSTM_out = LSTM(64,return_sequences=True)(CNN_out)

... (more code) ...

但这行不通。第二行报告“列表索引超出范围“我不明白发生了什么事。

我是 Keras 的新手，所以如果有人能帮助我，我真诚地感激。

这张图解释了CNN应该如何应用于每个时间步 https://i.stack.imgur.com/ublHo.jpg

问题出在你的输入上。你的输入是有形状的(100, 64)其中第一个维度是时间步长。所以忽略这一点，你的输入是有形状的(64) to a Conv1D.

现在，请参考Keras Conv1D 文档 https://keras.io/layers/convolutional/#conv1d，它表明输入应该是 3D 张量(batch_size, steps, input_dim)。忽略batch_size，你的输入应该是一个二维张量(steps, input_dim).

因此，您提供一维张量输入，其中输入的预期大小是二维张量。例如，如果您向Conv1D以单词的形式，那么你的句子中有 64 个单词，假设每个单词都用长度为 50 的向量进行编码，那么你的输入应该是(64, 50).

另外，请确保您向 LSTM 提供正确的输入，如下面的代码所示。

所以，正确的代码应该是

embedding_size = 50  # Set this accordingingly
mfcc_input = Input(shape=(100, 64, embedding_size), dtype='float', name='mfcc_input')
CNN_out = TimeDistributed(Conv1D(64, 16, activation='relu'))(mfcc_input)
CNN_out = BatchNormalization(axis=-1, momentum=0.99, epsilon=0.001, center=True, scale=True)(CNN_out)
CNN_out = TimeDistributed(MaxPooling1D(pool_size=(64-16+1), strides=None, padding='valid'))(CNN_out)

# Directly feeding CNN_out to LSTM will also raise Error, since the 3rd dimension is 1, you need to purge it as
CNN_out = Reshape((int(CNN_out.shape[1]), int(CNN_out.shape[3])))(CNN_out)

LSTM_out = LSTM(64,return_sequences=True)(CNN_out)

... (more code) ...

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何设置 1dCNN+LSTM 网络（Keras）的输入形状？的相关文章

保存为 HDF5 的图像未着色

我目前正在开发一个将文本文件和 jpg 图像转换为 HDF5 格式的程序用HDFView 3 0打开似乎图像仅以灰度保存 hdf h5py File Sample h5 img Image open Image jpg data np
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
Pandas Merge (pd.merge) 如何设置索引和连接

我有两个 pandas 数据框 dfLeft 和 dfRight 以日期作为索引 dfLeft cusip factorL date 2012 01 03 XXXX 4 5 2012 01 03 YYYY 6 2 2012 01 04 XX
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解

随机推荐

在 WPF 字体大小和“标准”字体大小之间转换

我注意到在 WPF 中 12 磅的默认字体大小大致相当于普通应用程序例如写字板中的 9 磅 WPF 中的 10 磅大约是 7 磅标准当我尝试匹配默认字体大小时在WPF写字板中的10 pt中我发现13是最接近的首先为什么WPF
如何在 PrimeNG 的 FileUpload 组件中中止文件上传？

一总结基于PrimeNG中选择的文件文件上传组件 https www primefaces org primeng fileupload 我想中止特定文件名模式的文件上传到后端服务器角度 6 0 7 PrimeNG 6 0 2 2 第
将四边形（四边形）拟合到斑点

应用不同的过滤和分割技术后我最终得到如下图像我可以访问一些轮廓检测函数这些函数返回该对象边缘上的点列表或者返回一个拟合的多边形尽管有很多边远多于 4 个我想要一种将四边形适合该形状的方法因为我知道它是应该是四边形的鞋盒的正面
PNG：deflate 和 zlib

我试图理解 PNG 的压缩但我似乎网上查了很多自相矛盾的资料我想了解 LZ77部分带链表的哈希表中的搜索是如何完成的这是在 deflate 中定义的吗或者在zlib中实现可以选择搜索方法吗 PNG 编码器解码器可以设置一些压
Firebase 模拟器返回空数据，但部署后工作正常

我编写了一个非常基本的 API 它将返回服务我尝试在模拟器中运行此 API 但它返回空数据 status success statusCode 200 message Services retrieved data 我已经设置了 fire
Snakemake - 无法从输出文件中确定输入文件中的通配符

我对snakemake很陌生而且对python也不太熟悉所以抱歉这可能是一个非常基本的愚蠢问题我目前正在构建一个管道来分析一组 bamfilesatlas https bitbucket org phaentu atlas wiki
使用 VSCode 时无法单步执行“仅我的代码”？

调试时 VSCode 中是否有像 Visual Studio 中的 Just my Code 选项一样的选项我想单步执行我自己的代码而不是像 next tick js 这样的所有内部节点代码我尝试过添加 skipFiles node
当我尝试导入添加到 WEB-INF/lib 的 jars 时，它们无法被识别：说该包不存在

我已经添加了org apache commons fileupload and org apache commons io封装成WEB INF lib我的项目基于 google appengine 的目录但是当我尝试导入 servlet
Matplotlib 行高表属性

我已经尝试了我能找到的所有命令和文档如何在这里设置行的高度 from pylab import Create a figure fig1 figure 1 ax1 1 fig1 add subplot 111 Add a table wi
Solr MoreLikeThis 不适用于多个分片？

我在 SolrCloud 中有 5 个节点集群每个节点有 2 个分片 Solr版本 6 3 0 现在当我运行 mlt 查询时它仅返回每个节点的结果并且不会将它们分布在所有分片节点上即没有给出任何结果给出结果我什至尝试将其指
硒隐式等待不起作用

这是我第一次使用 selenium 和无头浏览器因为我想使用 ajax 技术抓取一些网页效果很好但在某些情况下加载整个页面需要太多时间特别是当某些资源不可用时所以我必须为selenium设置一个超时首先我尝试过set page
Spring Integration 中的 @Router 与注释（请求/回复）

您能提供在 Spring Integration 中路由消息的任何示例吗按有效负载消息标头或类似以下内容进行过滤
将 -1 作为文件描述符传递给 mmap

我对 FC17 Linux 中的 ls 命令进行了 strace 以下是输出 execve usr bin ls ls 48 vars 0 brk 0 0x27c1000 mmap NULL 4096 PROT READ PROT WRIT
3D 数学：根据“向上”和“向上”正交向量计算倾斜（滚动）角度

我希望这是提出这个问题的正确位置和这个一样 https stackoverflow com questions 3035590 bank angle from up vector and look at vector 但表示为纯数学而不是图
隐式强制转换对委托类型推断的意外影响

我有一个简单的Money带有隐式转换的类型decimal struct Money decimal innerValue public static implicit operator Money decimal value return
在 Applescript 中监控 Spotify 曲目变化？

我正在尝试找出通过 Spotify 的 Applescript 库检测曲目更改的最佳方法到目前为止我已经尝试检查玩家位置如果它等于 0 则它是一个新曲目并且咆哮通知会再次出现如果有人重新开始一首歌等这通常不起作用我想知道是否更
为什么复制构造函数会有多个参数？

12 8 2 非模板构造函数对于类 X 是一个复制构造函数如果它的第一个参数是 X 类型 const X 易失性 X 或 const 易失性 X 并且要么没有其他参数或其他所有参数有默认参数 8 3 6 106 到目前为止我还没
似乎找不到循环 PL/SQL 数组的方法？

我正在尝试这样做 arrCauses APEX UTIL STRING TO TABLE P1 CAUSE FOR c IN 1 arrCauses count LOOP INSERT INTO DT EVENT CAUSE EVENT I
量角器未连接到 DevTools

当我的页面从 Protractor 运行时如何使用 Chrome 开发者工具来检查它当我尝试打开开发工具时我从量角器收到此错误 UnknownError disconnected not connected to DevTools S
如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个

如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

如何设置 1dCNN+LSTM 网络（Keras）的输入形状？ 的相关文章

随机推荐

热门标签

如何设置 1dCNN+LSTM 网络（Keras）的输入形状？的相关文章