如何清楚地解释Keras中units参数的含义？

2023-12-24

我想知道 LSTM 在 Keras 中是如何工作的。在本教程 https://machinelearningmastery.com/time-series-prediction-lstm-recurrent-neural-networks-python-keras/例如，与许多其他内容一样，您可以找到如下内容：

model.add(LSTM(4, input_shape=(1, look_back)))

“4”是什么意思。是该层神经元的数量吗？通过神经元，我的意思是每个实例给出一个输出？

其实我发现这场精彩的讨论 https://stackoverflow.com/questions/37901047/what-is-num-units-in-tensorflow-basiclstmcell但并没有真正相信其中提到的解释给出的参考 https://jasdeep06.github.io/posts/Understanding-LSTM-in-Tensorflow-MNIST/.

在方案上，大家可以看到num_units如图所示，我认为我说每个单元都是一个非常原子的 LSTM 单元（即 4 个门）并没有错。然而，这些单元是如何连接的？如果我是对的（但不确定），x_(t-1)是有尺寸的nb_features，所以每个特征都是一个单元的输入，并且num_unit必须等于nb_features right ?

现在，我们来谈谈keras。我读过了这篇文章和接受的答案 https://stackoverflow.com/questions/44273249/in-keras-what-exactly-am-i-configuring-when-i-create-a-stateful-lstm-layer-wi并遇到麻烦。事实上，答案是这样的：

基本上，形状就像 (batch_size, timespan, input_dim)，其中input_dim可以不同于unit

在这种情况下？我对之前的参考有麻烦......

此外，它还说，

Keras 中的 LSTM 仅定义了一个 LSTM 块，其单元为单位长度.

好的，但是如何定义完整的 LSTM 层呢？是不是input_shape隐式创建与数量一样多的块time_steps（根据我的说法，这是第一个参数input_shape我的代码中的参数？

谢谢你照亮我

编辑：是否还可以清楚地详细说明如何重塑数据，例如大小(n_samples, n_features)对于有状态的 LSTM 模型？如何处理 time_steps 和 batch_size ？

First, units在 LSTM 中是NOTtime_steps 的数量。

每个 LSTM 单元（出现在给定的 time_step 处）接受输入x并形成一个隐藏状态向量a，这个隐藏单位向量的长度就是所谓的units在 LSTM（Keras）中。

您应该记住，代码只创建了一个 RNN 单元

keras.layers.LSTM(units, activation='tanh', …… )

RNN 操作由类本身重复 Tx 次。

我已经链接了this https://zhuanlan.zhihu.com/p/58854907通过非常简单的代码帮助您更好地理解它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何清楚地解释Keras中units参数的含义？的相关文章

ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
Python 子进程（ffmpeg）仅在我按 Ctrl-C 程序时启动？

我正在尝试使用 Cygwin 和 Python 2 7 并行运行一些 ffmpeg 命令这大概是我所拥有的 import subprocess processes set commands ffmpeg i input mp4 outpu
如何使用 conda 在一行中安装多个包？

我需要使用 conda 安装以下多个软件包我不确定 conda forge 是什么有些使用 conda forge 有些不使用它是否可以将它们安装成一行而不需要一一安装谢谢 conda install c conda forge d
pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
类型错误：float() 参数必须是字符串或数字，而不是“列表”python

我的 Python 有问题这是我的代码 def calcola a input b float a 0 split c float a 0 split d float a 0 split e float a 0 split j float
Django 不会以奇怪的错误“AttributeError: 'module' object has no attribute 'getargspec'”启动

我对 Django 的内部结构有点缺乏经验所以我现在完全陷入困境它昨天起作用了但我不记得我改变过任何重要的东西当我转身时DEBUG True任何恰好位于列表中第一个的模块上都有堆栈跟踪 Traceback most recent c
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
Django 模型字段默认基于另一个模型字段

我使用 Django Admin 构建一个管理站点有两张表一张是ModelA其中有数据另一个是ModelB里面什么也没有如果一个模型字段b b in ModelB为None 可以显示在网页上值为ModelA的场a b 我不知道该怎
如何将类添加到 LinkML 中的 SchemaDefinition？

中的图表https linkml io linkml model docs SchemaDefinition https linkml io linkml model docs SchemaDefinition and https link
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
用于多个窗口的 Tkinter 示例代码，为什么按钮无法正确加载？

我正在编写一个程序应该按一下按钮即可打开一个窗口按另一个按钮关闭新打开的窗口我使用类以便稍后可以将代码插入到更大的程序中但是我无法正确加载按钮 import tkinter as tk class Demo1 tk Frame
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装
在python中对列表列表执行行总和和列总和

我想用python计算矩阵的行和和列和但是由于信息安全要求我无法使用任何外部库因此为了创建矩阵我使用了列表列表如下所示 matrix 0 for x in range 5 for y in range 5 for pos in

随机推荐

MySQL 备份：我可以将单个 MyISAM 表文件复制到另一台具有不同 MySQL 版本和不同操作系统的服务器吗？

我的意思是复制单个 MyISAM 表文件是关闭 mysqld 并将 frm myd 和 myi 文件从一个数据库文件夹复制到另一个数据库文件夹问题 a 我可以使用这种方式将MySQL数据库文件夹从一台服务器备份到另一台具有不同MySQL
在 Web 开发中 - 哪些 ASP.net 可以做而 PHP 不能做？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何调整 PDF 上的页边距，我需要将 PDF 设置为适合页面

我的基本脚本运行良好它完全按照我想要的方式做它获取 Google Sheet 将其转换为 PDF 然后通过电子邮件将 PDF 发送给我我的问题是如何调整 PDF 的页边距我需要设置 PDF 以适合页面我不能只调整纸张大小因为它
TeamCity - FTP 上传到 Azure 失败

我正在尝试使用 TeamCity 构建将 Net Core 2 0 项目部署到 Azure Web 应用程序有 3 个步骤 1 Nuget 恢复2 点网发布3 FTP 上传第 2 步之后我会得到一个文件夹 Output 其中包含我需要
CSS：保持给定高度的元素的纵横比

上面可能重复的链接不是这种情况的解决方案因为高度对于多个断点来说将是固定值我有一些 DIVdisplay inline block 所以它们并排漂浮得很好这些 DIV 都具有相同的高度例如height 300px 稍后我将使用 A
python：查找html标签并替换其属性[重复]

这个问题在这里已经有答案了我需要执行以下操作获取html文档查找所有出现的 img 标签获取它们的 src 属性将创建的 url 传递给处理将 src 属性更改为新属性使用 Python 2 7 完成所有这些工作附我听说过
AngularJS，如何将一个变量绑定到其他两个绑定变量的串联？

我是 AngularJS 的新手正在尝试构建一个 AngularJS 练习应用程序其中用户将连接来自多个输入的 url 即协议域路径 param1 param2 param3 等该应用程序将创建一个指向该网址的链接 a proto
如何向 JTable 单元格添加下拉菜单

这可能是之前问过的一个问题在发帖之前我进行了很多搜索但找不到任何可接受的有人可以告诉我一种方法来做到这一点吗当我单击单元格时我只需要获得一个下拉菜单以便我必须从中选择一个值作为限制用户选择的一种方式如果有人可以帮助解决这个问
面向对象编程：寻找好的教程[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
GitHub Atom：如何根据名称对某些文件应用特定的语法突出显示

我该如何配置GitHub 的 Atom让它自动设置一个特定的语法高亮基于名称和或扩展名的文件名具体来说我希望它自动设置Ruby 语法高亮到 Cocoapods 的Podfiles 从 Atom 1 0 8 开始无需file types
为什么在生产环境下运行时，我无法在实时服务器上调用 Coldfusion CFC 中的函数？

我不知所措我通过 Ajax 发布到 Coldfusion8 cfc 虽然它在我的本地计算机上运行良好但在实时服务器上我无法调用此 CFC 或其扩展 CFC 中的任何函数我想做这个
Laravel 5 找不到 css 文件

我刚刚在 MAMP 上安装了 Laravel 5 项目但我的页面找不到 css 文件这是我的 app blade php 文件中 css 的链接我的 htaccess 文件有这一行 RewriteBase laravel site l
将 2 个值传递给 JavaScript 函数

我正在尝试将 2 个值传递给 javascript xmlHttp 请求这些值被传递给 JavaScript 函数我成功地将单个值传递给 javscript 函数但现在我需要传递 2 个值粗体值是我想要在 JavaScript 中的
如何获取 matplotlib Axes 实例

我需要使用一些股票数据制作烛台图为此我想使用该功能matplotlib finance candlestick https github com matplotlib matplotlib blob master lib matplotl
如何制作一个动态大小的数组？动态数组的一般用法（也许还有指针）？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在尝试制作一个程序接受用户输入假设所有输入都是int 将其存储在没有起始大小的数组中即不是 gt array 5 进而将存
使用效果包自定义绘图

我尝试从效果包中自定义多线图无论如何是否可以将下面示例中的图例放置在绘图区域内而不是图表上方或者有谁知道如何使用 ggplot2 绘制由effects包计算的多线回归的结果我很感激任何帮助 Andy Example library
Java 可以在调用链中进行 group&order&top 吗？

我有一个 POJO 类 class A public int id public String groupName public String getGroupName return this groupName public int va
使用 XStream 序列化 Hibernate 对象的问题

我一直面临这个问题序列化时的 hibernate 对象会生成意外的 xml 其中包含 Hibernate 中的所有检测代码在序列化对象之前我们对对象进行了一些清理但是是否有标准选项可用于直接序列化对象我以前没有使用过 XStre
并发冲突：UpdateCommand 影响了预期 1 条记录中的 0 条。 DB concurrencyException 未处理

我定义了 2 个数据集和 2 个数据适配器每个数据集一个创建后我为 2 个 dataAdapter 中的每一个定义了一个 SqlCommandBuilder 到这里一切都很好我可以使用 dataAdapter1 Update dat
如何清楚地解释Keras中units参数的含义？

我想知道 LSTM 在 Keras 中是如何工作的在本教程 https machinelearningmastery com time series prediction lstm recurrent neural networks py

如何清楚地解释Keras中units参数的含义？

如何清楚地解释Keras中units参数的含义？ 的相关文章

随机推荐

热门标签

如何清楚地解释Keras中units参数的含义？的相关文章