对于LSTM输入层、隐含层及输出层参数的个人理解

2023-11-02

原文地址

LSTM输入层要求的维度是三维的,其中包含三个参数:batch_size, input_dim和time_step。隐含层有一个参数:n_hidden。输出层有两个参数:n_hidden和output_dim。下面举两个例子:利用LSTM识别MNIST手写数字集和LSTM时间序列分析,谈谈个人对这些参数含义的理解。

1. 利用LSTM识别MNIST手写数字集


输入层:首先说下batch_size。这个参数其实和其他神经网络的batch_size意义相同,都指一次性输入到神经网络中训练的个数。这里batch_size=128,含义是一次性将128个图像输入到LSTM中进行训练,完成一次参数计算和更新。再说说n_steps。n_steps实际上指的是构造的LSTM总共有多少个时间上的输入。在这里取n_step = 28,指的是按时间顺序依次输入28次,在同一时刻输入的个数为batch_size * n_input。在MNIST数据集中,一幅图片表示为28*28的矩阵,因此如果一次输入1行,那么要先后依次输入28行才能将一个图片的信息完全输入。那么同时input_dim(在此处为n_input)的含义也很清楚了,就是一次输入的数据维数,在这里就是1行的数据个数。因此,输入端的操作是,在t时刻输入128幅图片的第1行矩阵,t+1时刻输入128幅图片的第2行矩阵。以此类推直到输入完毕。 
隐含层:隐含层只有一个新的参数:n_hidden。这个参数表示的是用于记忆和储存过去状态的节点个数。 
输出层:输出层也只有一个新的参数:output_dim(在此处为n_classes)。这个参数的含义是输出结果维数。在MNIST数据集中,由于做的是0~9的分类,所以输出维度自然是10,类似于softmax分类。

2. LSTM时间序列分析

输入层:在这个例子中,使用了Keras作为搭建LSTM工具。查看Keras的文档,得知其对输入数据的要求是

形如(samples,timesteps,input_dim)的3D张量
而第二个例子中对于输入数据做的处理为 
x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1)) 
因此不难比较得到:


由于这个例子是给定一个已知序列,对该序列接下来的走势进行预测,因此自然而然想到把一个序列切成训练集和测试集,训练集再根据合适的时间长度分成t~(t+n)的训练集和t+n+1的测试集。那么batch_size的含义是一次性输入训练的序列数。time_step为取的一个时间序列的长度,也就是上一句话的n。在这个例子中,input_dim为1,说明在一个时间点,一个序列只输入1个点。隐含层和输出层类似,不再重复。
 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

对于LSTM输入层、隐含层及输出层参数的个人理解 的相关文章

随机推荐

  • 使用plsql工具查看oracle中的blob字段的可视化值

    SELECT utl raw cast to varchar2 dbms lob substr t detailsql from Voucher t
  • 每天一个设计模式——装饰模式(C++实现)

    设计模式的代码十分难写的 要充分的体现可复用性 网上有着大量关于设计模式的代码 其中很多的代码违背了很多设计原则 比如依赖倒置原则 开放封闭原则 需要我们明辨是非 设计模式的原则大于使用哪个设计模式 类的组合关系也大于类的继承 通过不断的写
  • ECCV 2022

    作者 机器之心编辑部 来源 机器之心 如何将现有的图像 文本多模态大模型 例如 OpenAI CLIP 用于视频内容理解 是一个非常实用且具有前景的研究课题 它不仅可以充分挖掘图像大模型的潜力 还可以为视频大模型的设计和研究铺平道路 在视频
  • 年轻人还记得KCP吗?什么是KCP,怎么使用呢!!!

    一 什么是KCP KCP是一种网络传输协议 A Fast and Reliable ARQ Protocol 可以视它为TCP的代替品 但是它运行于用户空间 它不管底层的发送与接收 只是个纯算法实现可靠传输 它的特点是牺牲带宽来降低延迟 因
  • C51单片机学习笔记(二)——花样流水灯的实现

    C51单片机学习笔记 二 花样流水灯的实现 文章目录 C51单片机学习笔记 二 花样流水灯的实现 1 单片机引脚 晶振 复位的作用 2 流水灯原理图 3 单片机的周期 4 延时函数的编写 5 使用 位操作 控制流水灯 6 使用字节控制 并行
  • lenovo联想笔记本ThinkBook 14 Gen5+ IRH(21HW)原装Win11系统镜像原厂OEM恢复出厂状态

    LENOVO联想笔记本电脑 ThinkBook 14 Gen5 IRH 21HW 原厂Windows11原装OEM系统 恢复出厂时状态系统 系统自带所有驱动 出厂主题壁纸LOGO Office办公软件 联想电脑管家等预装程序 所需要工具 1
  • java客户端作为kafka消费者测试

    README 本文主要对 java客户端作为kafka 消费者进行测试 生产者由 kafka客户端扮演 1 普通消费者 设置消费者组 重置消费者的offset 即每次都从最头开始消费 默认仅保持7天内数据 类似于 命令行 from begi
  • 【node.js】Node.js下载安装(在vscode中使用)01

    博 主 初映CY的前说 个人信条 想要变成得到 中间还有做到 本文核心 Node js的下载安装操作 目录 一 node介绍 二 node js下载安装 一 node介绍 Node js是一个Javascript运行环境 runtime 实
  • Java句柄与指针

    java中的句柄分为两种 对象句柄 jvm中对象访问句柄 一 对象句柄 句柄 一个唯一的整数 作为对象的身份id 区分不同的对象 和同类中的不同实例 程序可以通过句柄访问对象的部分信息 句柄不代表对象的内存地址 在Java中的任何东西都可以
  • mysql 用户量,MySQL ── 用户数全球排名第一的免费开源关系型数据库

    MySQL 是一种关联数据库 关联数据库会将数据保存在不同表中 而不是将所有数据放在一个大仓库内 这样就增加了速度并提高了灵活性 MySQL 所使用的 SQL 语言是用于访问数据库的最常用标准化语言 MySQL 软件采用了双 授权政策 社区
  • 打开qt文件报“could not decode ... with “UTF-8“ -encoding” Editting not possible

    从别人那拷来的qt程序 报错如下 深入解决不能在文件编辑中切换中文输入的问题 仔细按照以下三步操作 可以解决 1 点击 Select Encoding 按编码重新载入GB2312格式或者GBK 虽然能编辑代码但仍不能切换中英文输入 此时 应
  • 使用ftp实现windows和ios的公网文件夹共享

    请注意 本文主要研究的是如何实现在公网环境下 即电脑和ipad或iPhone设备不在同一网络下 实现文件夹共享 如果你想实现的仅仅是局域网间的文件夹共享 可以参考博客使用SMB和ipad自带的文件app实现 操作简单实现快ipad和wind
  • 设计模式:解释器模式

    定义 给定一种语言 定义他的文法的一种表示 并定义一个解释器 该解释器使用该表示来解释语言中句子 类型 行为类模式 类图 解释器模式是一个比较少用的模式 本人之前也没有用过这个模式 下面我们就来一起看一下解释器模式 解释器模式的结构 抽象解
  • reduce端join算法实现

    数据 订单数据表order date pid amount 20150710 P0001 2 20150710 P0002 3 商品信息表product pid pname category id price P0001 小米5 1000
  • linux系统下的动态壁纸,Ubuntu 10.04下实现动态桌面壁纸

    不知大家在使用Ubuntu时有没有注意到 Ubuntu下是可以实现多张壁纸动态切换的 好像Win7下也有类似的功能 曾经使用 win7一段时间 我也是最近才注意到这点 下面是在Ubuntu 10 04下实验的 之前版本的应该也可以 实现原理
  • typescript第五天—联合类型和类型保护、Enum枚举类型

    联合类型和类型保护 联合类型展示 所谓联合类型 可以认为一个变量可能有两种或两种以上的类型 用代码举个例子 声明两个接口Waiter 服务员 接口和Teacher 技师 接口 然后在写一个judgeWho 判断是谁 的方法 里边传入一个an
  • 每天一个小题目——公交车乘客

    题目描述 一个公交车经过n个站点 乘客从前门上车 从后门下车 现在统计了在第i个站 下车人数a i 以及上车人数b i 问公交车运行时候车上最多有多少乘客 输入 第一行读入一个整数n 1 lt n lt 100 表示有n个站点 接下来n行
  • 宝塔面板网站解决跨域问题

    宝塔面板网站解决跨域问题解决方案如下 1 如果使用的nginx 打开网站的设置 找到配置文件 添加如下代码 代码如下 add header Access Control Allow Origin add header Access Cont
  • 软件测试CPU基础知识

    1 cpu和程序的执行 PC 程序计数器 堆栈指针 每个程序都有一个栈 PSW 程序的状态 2 CPU两种运行状态 用户态 内核态 Linux内部结构 top命令查看 CPU sy 内核消耗的指标 us 用户消耗的指标 一般us ys 4
  • 对于LSTM输入层、隐含层及输出层参数的个人理解

    原文地址 LSTM输入层要求的维度是三维的 其中包含三个参数 batch size input dim和time step 隐含层有一个参数 n hidden 输出层有两个参数 n hidden和output dim 下面举两个例子 利用L