Keras LSTM 层实现背后的架构是什么？

2023-12-26

Keras 中 LSTM 层的输入维度如何转换为输出维度？从阅读可拉的博客文章 http://colah.github.io/posts/2015-08-Understanding-LSTMs/，看起来好像有"timesteps"（又名input_dim或中的第一个值input_shape）应等于神经元的数量，神经元的数量应等于该 LSTM 层的输出数量（由units论证LSTM layer).

来自阅读这个帖子 https://stats.stackexchange.com/questions/274478/understanding-input-shape-parameter-in-lstm-with-keras，我了解输入形状。我感到困惑的是 Keras 如何将输入插入到每个 LSTM“智能神经元”中。

Keras LSTM 参考 https://keras.io/layers/recurrent/#lstm

让我困惑的示例代码：

model = Sequential()
model.add(LSTM(32, input_shape=(10, 64)))
model.add(Dense(2))

由此，我认为 LSTM 层有 10 个神经元，每个神经元都被输入一个长度为 64 的向量。然而，它似乎有 32 个神经元，我不知道每个神经元输入了什么。据我所知，为了将 LSTM 连接到密集层，我们只需将所有 32 个输出插入到 2 个神经元中的每一个即可。让我困惑的是 LSTM 的输入层。

(类似的帖子，但不完全是我需要的 https://stackoverflow.com/questions/39969717/how-to-process-input-and-output-shape-for-keras-lstm)

2020 年重新审视和更新：我是部分地正确的！该架构有 32 个神经元。 10 代表时间步值。每个神经元都被输入一个 64 长度的向量（可能代表一个单词向量），代表 10 个时间步长的 64 个特征（可能是 64 个有助于识别单词的单词）。

32代表神经元的数量。它代表该层有多少个隐藏状态，也代表输出维度（因为我们在每个 LSTM 神经元的末尾输出一个隐藏状态）。

最后，最后一个时间步从 32 个神经元生成的 32 维输出向量被馈送到 2 个神经元的密集层，这基本上意味着将 32 长度向量插入到两个神经元，并在输入和激活上赋予权重。

更多阅读一些有帮助的答案：

了解 Keras LSTM https://stackoverflow.com/questions/38714959/understanding-keras-lstms
当我创建一个包含 N 个单元的有状态 LSTM 层时，我到底要配置什么 https://stackoverflow.com/questions/44273249/in-keras-what-exactly-am-i-configuring-when-i-create-a-stateful-lstm-layer-wi
初始化 LSTM 隐藏状态喀拉斯 https://stackoverflow.com/questions/42415909/initializing-lstm-hidden-state-tensorflow-keras

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras LSTM 层实现背后的架构是什么？的相关文章

使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
刷新访问令牌时出现“invalid_grant”错误的情况？

最近我一直在为这个问题揪心一些背景使用oauth2客户端 https code google com p google api python client 库来管理用户的令牌这些令牌用于定期并发执行各种后台任务每次要为用户运行其中一
错误只有 size-1 数组可以转换为 Python 标量

我有这个代码 for a in data X for i in a if not i isdigit x hash i data X column row x row row 1 row 0 column column 1 desired
OpenCV Python 删除图像中的某些对象

我正在使用带有 opencv 和 numpy 的 python 来检测天文中的星星例如这个1 https i stack imgur com AKwEJ jpg图片使用模板匹配我可以用阈值检测星星单击 2 2 https i sta
垂直线 axvline 在 matplotlib 的 loglog 图中绘制位于错误位置的线

我在使用 axvline 在 matplotlib 的 loglog 图中绘制垂直线时遇到问题第一个问题是垂直线没有出现在正确的位置第二个问题可能相关的是当我放大或平移绘图时垂直线只是保持在原位并且没有通过平移滑动绘图或放大
运行源代码中包含 Unicode 字符的 Python 2.7 代码

我想运行一个在源代码中包含 unicode utf 8 字符的 Python 源文件我知道这可以通过添加评论来完成 coding utf 8 在一开始的时候但是我希望不使用这种方法来做到这一点我能想到的一种方法是以转义形式编写 un
Keras，如何获取每一层的输出？

我已经用 CNN 训练了一个二元分类模型这是我的代码 model Sequential model add Convolution2D nb filters kernel size 0 kernel size 1 border mode
Python - 为什么这段代码被视为生成器？

我有一个名为 mb 的列表其格式为 Company Name Rep Mth 1 Calls Mth 1 Inv Totals Mth 1 Inv Vol Mth 2 等等在下面的代码中我只是添加了一个包含 38 个 0 的新列表这
Python：如何重构循环导入

我有件事可以帮你做engine setState
如何通过 Python socket.send() 发送字符串以外的任何内容

我对 Python 编程非常陌生但出于必要我必须快速地将一些东西组合在一起我正在尝试通过 UDP 发送一些数据除了当我执行 socket send 时我必须以字符串形式输入数据之外一切都正常这是我的程序这样你就可以看到我在做
python 语言环境奇怪的错误。这究竟是怎么回事？

所以今天我升级到了 bazaar 2 0 2 我开始收到这条消息顺便说一句我在雪豹上 bzr warning unknown locale UTF 8 Could not determine what text encoding to
Docker：通过 Gunicorn 运行 Flask 应用程序 - Worker 超时？表现不佳？

我正在尝试创建一个用Python Flask编写的新应用程序由gunicorn运行然后进行dockerized 我遇到的问题是 docker 容器内的性能非常差不一致我最终得到了响应但我不明白为什么性能会下降有时我会在日志中看到
Python/Flask：应用程序在关闭后正在运行

我正在开发一个简单的 Flask Web 应用程序我使用 Eclipse Pydev 当我开发该应用程序时由于代码更改我必须经常重新启动该应用程序这就是问题所在当我运行该应用程序时我可以在本地主机上看到该框架这很好但是当我想
将带有两层分隔符的字符串转换为字典 - python

给定一个字符串 s x t1 ny t2 nz t3 我想转换成字典 sdic x 1 y 2 z 3 我通过这样做让它工作 sdic dict tuple j split t for j in i for i in s split n F
如何在 Tkinter 的 Button 小部件中创建多个标签？

我想知道如何在 Tkinter 中创建具有多个标签的按钮小部件如下图所示带有子标签的按钮 https i stack imgur com jOZRw jpg正如您所看到的在某些按钮中有一个子标签例如按钮 X 有另一个小标签 A 我试
tweepy 流到 sqlite 数据库 - 语法错误[重复]

这个问题在这里已经有答案了可能的重复 tweepy 流到 sqlite 数据库语法无效 https stackoverflow com questions 9434205 tweepy stream to sqlite database
如何在 Pandas 数据框中用 NaN 替换一系列值？

我有一个巨大的数据框我应该如何用 NaN 替换一系列值 200 100 数据框您可以使用pd DataFrame mask https pandas pydata org pandas docs stable generated pan
如何在 Python 中解析损坏的 XML？

我无法影响的服务器发送的 XML 非常损坏具体来说 Unicode WHITE STAR 将被编码为 UTF 8 E2 98 86 然后使用 Latin 1 转换为 HTML 实体表我得到的是 acirc 98 86 9 个字节位于声
python IDLE shell 似乎无法正确处理一些转义

例如 b 退格键打印为四元在下面的示例中显示为但是 n 换行是可以的 gt gt gt print abc bd abc d gt gt gt print abc nd abc d 我在 Vista pro python 2 7 下运行
如何获取所有Python标准库模块的列表？

我想要类似的东西sys builtin module names标准库除外其他不起作用的事情 sys modules 只显示已经加载的模块 sys prefix 包含非标准库模块并且似乎无法在 virtualenv 内工作的路径我想要这

随机推荐

如何在 Java 中创建充满方法的列表并对其进行迭代（使用方法）

我希望能够创建充满我自己的方法的列表集合数组并在迭代的每个步骤中调用该方法对此最好的解决方案是什么我想要这样的东西 List a new List a add myCustomMethod1 a add myCustomMetho
如何在提交时跳转到锚点 - 而不是页面顶部

在此页面上我有一个怀孕计算器脚本 http taranakimidwife co nz index php http taranakimidwife co nz index php 项目ID 104 目前计算的是按页面跳转回顶部我希望它转
DLL 中的共享内存

DLL 中的共享内存是如何工作的当DLL附加到进程时它使用与进程相同的内存地址假设 DLL 中有以下函数 int data 0 int foo if data data new int random return data 当进程 A
inconsolata 缺少构建 R 小插图

在 ubuntu 14 04 上使用 texlive 检查 R 包例如devtools check 会返回 LaTeX errors found LaTeX Error File inconsolata sty not found Typ
Mac mysql 错误 1045 (28000): 用户 'root'@'localhost' 的访问被拒绝

Mac 10 10 1 Mysql 5 6 22 当我在我的mac上安装mysql时我写mysql u root p在终端上出现错误错误 1045 28000 用户 root localhost 的访问被拒绝使用密码 YES 当我使
如何恢复上次提交并保留 Mercurial 中的更改？

我有三个提交 1 2 和 3 如何回滚 2 和 3 并且仍然保留它们更改的文件 1 2 3 gt 1 and changed files of 2 and 3 您使用strip命令从存储库中删除变更集及其所有后代与 keep optio
如何以编程方式覆盖按钮？

我想要完成的是在运行时在屏幕中间放置一个按钮作为最顶层覆盖其下面的任何内容它不大所以它不会完全覆盖屏幕只是覆盖它下面的任何东西我考虑创建一个自定义对话框但是它会阻止所有其他用户输入我希望这个新按钮下方的所有视图都能正常运
在 Typescript 中使用 FileSystemWatcher（Visual Studio Code 扩展）

我是 TypeScript 和 Visual Studio Code 的新手想要为 Visual Studio Code 开发一个插件但我对一个由FileSystemWatcher 激活后在我的扩展中我创建了一个FileSystemW
如何判断EditText中的输入是否为整数？

大家好我是 Android 编程新手我正在尝试建立一个活动其中包括edittext场和一个button 当用户输入整数时该按钮将引导他们进入下一个活动但是如果有办法检查用户输入的类型我不会这样做有人可以帮助我吗非常感谢从
ng-model 依赖性的隔离范围陷阱

好吧由于 AngularJS 文档网站上的改进此文档按钮不起作用并且讨论现已结束我想问一个关于隔离范围陷阱段落的问题ng模型控制器 http docs angularjs org api ng directive 3angMo
如何查找可能引发哪些异常

我正在尝试找到最好的方法来找出我的 python 代码可能引发的异常你们使用的最佳方法是什么到目前为止我可以祈祷是在某处的在线文档中这么说的很少这样做抓取 py 文件以获取 raise 语句必须有更好的方法来获取这些信息这个问
全日历多个营业时间，每天两班制

我已将完整日历集成到我的网站中我的要求之一是从数据库中获取营业时间并将其呈现在日历上所以基本上每天都有两班早上和晚上我需要能够创建一个营业时间数组其中的值从数据库中填充开箱即用我可以使用下面的代码来呈现常见的营业时间 busi
如何改进 euler 14 的代码？

我解决了欧拉问题 14 http projecteuler net problem 14但我使用的程序非常慢我看看其他人做了什么他们都想出了优雅的解决方案我试图理解他们的代码但没有取得多大成功这是我的代码确定 Collat z
在 Stream.read 中使用 Longint 计数和 Int64 大小不是很危险吗？

我正在检查TMemoryStream http docwiki embarcadero com Libraries Tokyo en System Classes TMemoryStream LoadFromStream类并发现以下例程 p
OCaml 中短路运算符和 let 的求值顺序

在 OCaml 中当使用let为短路运算符分配别名 or 它不再短路操作数的求值这并不直观这种行为的原因是什么考虑以下代码 let f Printf printf f false let g Printf printf g true
Ruby Activerecord IN 子句

我想知道是否有人知道如何在 activerecord 中执行 IN 子句不幸的是 IN 子句几乎无法通过谷歌搜索所以我必须在这里发布基本上我想回答这样的问题给我这些宿舍中的所有大学生其中宿舍id在此数组 id数组中我知道如何在
使用opencv检测图像中的文本

我需要检测图像中的文本这里有一些在大多数情况下都有效的代码但并非全部请参阅附加的输入输出图像 code include string include fstream include var bin opencv include op
在运行时将 X 个带有 SelectedItem 的 ComboBox 添加到 DataGrid (WPF)

我想创建一整行ComboBoxes in a DataGrid 我在以下方面取得了一些进展 Declare it private DataGridComboBoxColumn CreateCustomComboBoxDataSouce st
如何在我的 swing 应用程序中使用 Java 类调用并向 Servlet 传递参数？ [复制]

这个问题在这里已经有答案了在我的 Swing 应用程序中我需要使用登录页面将参数传递给 servlet 来对用户进行身份验证在 Web 应用程序中我们可以使用 Ajax 和 JavaScript 来完成此操作但是如何在我的 Sw
Keras LSTM 层实现背后的架构是什么？

Keras 中 LSTM 层的输入维度如何转换为输出维度从阅读可拉的博客文章 http colah github io posts 2015 08 Understanding LSTMs 看起来好像有 timesteps 又名input

Keras LSTM 层实现背后的架构是什么？

Keras LSTM 层实现背后的架构是什么？ 的相关文章

随机推荐

热门标签

Keras LSTM 层实现背后的架构是什么？的相关文章