【机器学习】LSTM 讲解

2023-11-17

2. LSTM

2.1. 长期依赖问题

标准 RNN 结构在理论上完全可以实现将最初的信息保留到即使很远的时刻,但是在实践中发现 RNN 会受到短时记忆的影响。如果一条序列足够长,那它们将很难将信息从较早的时刻传送到后面的时刻。 因此,如果正在尝试处理一段文本进行预测,RNN 可能从一开始就会遗漏重要信息。比如我们尝试预测 “I grew up in France … I speak fluent French” 这句话的最后一个词 ”French“ 。当前的信息(“I speak fluent”)表明接下来的单词是很可能是语言的名字。但是需要哪种语言,我们就要根据离当前位置很远的 “France” 来确定。这就说明相关信息和当前预测词的位置之间的间隔可能非常大,随着这间隔不断变大,RNN 就会失去学习连接如此远的信息的能力。 这就是我们上面提到的 RNN 最致命的缺点。

为了解决这个问题,提出了 LSTM 。

2.2. 网络结构

LSTM 属于 RNN 的扩展模型,二者的区别仅在于每个单元内部结构不同。LSTM 单元结构如下。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-74kg3mr0-1662638666654)(C:\Users\23343\AppData\Roaming\Typora\typora-user-images\image-20220907153127794.png)]

其中,黄色矩形表示一层神经网络,包含权重和激活函数,矩形中的符号表明激活函数的类型,

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【机器学习】LSTM 讲解 的相关文章

随机推荐

  • AttemptID:attempt_1557891872692_0001_r_000000_0 Timed out after 3600 secs

    背景 做kylin 的时候 执行了 hive的命令 是hive数据的重新分布 结果在reduce的时候阻塞了 查看原因为 AttemptID attempt 1557891872692 0001 r 000000 0 Timed out a
  • 公有云、私有云、混合云

    云的部署方式有很多种 如公有云 私有云 混合云等 部署在云上的SaaS主要分为公有云SaaS和私有云SaaS 行业主流的SaaS部署模式是公有云SaaS 私有云部署模式 适用于某些有特殊要求的行业和企业业务 要求有较大的私有化和定制化空间的
  • python case when用法_SQL之CASE WHEN用法详解

    简单CASE WHEN函数 CASE SCORE WHEN A THEN 优 ELSE 不及格 END CASE SCORE WHEN B THEN 良 ELSE 不及格 END CASE SCORE WHEN C THEN 中 ELSE
  • angular蚂蚁_angular4 调用api

    angular2 问题请教 angular2 通过http服务进行对后端api的远程调用 我简单的尝试了一下 发现了几个问题 记录一下 以方便查找问题 angular2 http服务的跨域问题 跨域本身就是一个很复杂的问题 angular2
  • 剑指 Offer 27. 二叉树的镜像 -- 递归

    0 题目描述 leetcode原题链接 剑指 Offer 27 二叉树的镜像 1 递归算法 根据二叉树镜像的定义 考虑递归遍历 d f s mathrm dfs dfs 二叉树 交换每个节点的左 右子节点 即可生成 二叉树的镜像 递归解析
  • Qt入门-文本框类QLineEdit和QTextEdit

    QLineEdit是单行文本框 QTextEdit是多行文本框 1 单行文本框QLineEdit 常用的方法和属性 a 获取和设置文本对齐方式 Qt Alignment alignment const void setAlignment Q
  • MT6739的Android9.0 Camera kernel 驱动

    文章目录 Kernel 层驱动的实现 Camera 开机流程 Camera 驱动的文件结构 Camera 驱动初始化流程 Camera 入口函数 imgsensor init 注册的平台驱动结构体 gimgsensor platform d
  • Linux文本处理工具和正则表达式

    Linux文本处理工具和正则表达式 一 查看 截取和修改文本的工具 1 查看文本的工具 cat 最常用的文件查看命令 当不指明文件或者文件名为一杠 时 读取标准输入 cat OPTION FILE A 显示所有控制符 tab键 I 行结束符
  • 用户变量与系统变量的区别

    用户变量仅对当前用户生效 若有其他用户登录 对其无效 系统变量对所有用户生效 其中 引用已经设置的其他环境变量 使用 变量名 如 MyJAVA PATH C JAVA TheBin MyJAVA PATH Bin 那么 TheBin实际为
  • 电脑调分辨率黑屏了怎么办_电脑屏幕分辨率调节失败的解决方法

    在之前 我们讲到了电脑屏幕分辨率的问题 更加自己电脑的尺寸 来调节出最合适的屏幕分辨率 但有些网友在反映到电脑屏幕分辩率调了却没有反映 遇到这样的情况 我们该如何解决 电脑屏幕分辨率 调节分辨率的三种方法 方法一 右键单击桌面空白处 选择
  • 在linux中如何创建进程,如何在Linux中创建进程?

    加载到内存中并执行的程序称为进程 简单来说 一个进程就是一个正在执行的程序 让我们检查一下如何在Linux中创建进程 可以通过fork 系统调用创建一个新进程 新进程包含原始进程的地址空间的副本 fork 从现有流程创建新流程 现有进程称为
  • Springmvc3+Spring3+Freemarker整合异常

    Springmvc3 Spring3 Freemarker整合异常 提示缺少ui等类 主要异常信息如下 org springframework beans factory BeanCreationException Error creati
  • INFO zookeeper.ClientCnxn: Opening socket connection to server***/192.168.80.151:2181. Will not

    at org apache zookeeper ClientCnxnSocketNIO doTransport ClientCnxnSocketNIO java 361 at org apache zookeeper ClientCnxn
  • win10查看端口号是否被占用及解除占用的常用命令

    netstat ano 查看所有端口号占用情况 netstat ano findstr XXX 查看端口号为XXX的占用情况 如下 得到进程号为12160的进程正在占用本地的9090端口号 如果只是想释放9090端口到这一步就可以了 我们可
  • JDBC操作

    在IDEA中用java中驱动数据库 并使用Java语言操作数据库 10 1 数据库驱动 驱动 比如 声卡 显卡 数据库 我们的程序会通过数据库驱动和数据库打交道 10 2 JDBC sun公司为了简化开发人员的 对数据库的统一 操作 提供了
  • 我零基础,非计算机专业,想快速学习一门编程语言可行吗?

    都说要真正掌握一门编程语言 是件很困难的事情 尤其对于初学者而言 这话说的的确有几分道理 但其实学习编程语言的难度也并没有大多数人想的那么大 因为每个人学习会因为多种因素而有所不同 例如个人学习能力 学习背景 学习时间 编程语言本身等等 首
  • 什么是归纳偏置

    首先给出百度百科的定义 当学习器去预测其未遇到过的输入的结果时 会做一些假设 Mitchell 1980 而学习算法中归纳偏置则是这些假设的集合 是指在学习算法之初就通过人为偏好 将某一种解决方案优先于其他解 这既可以包含在底层数据分布假设
  • python实现对LabelImg标注的xml文件修改其标签名字

    使用labelImg标注数据时 通过python批量修改已经标注的数据标签名字 例如 本程序将标注生成的xml文件中的目标名字 zero 批量修改为 num 示例程序如下 通过解析xml文件 批量修改xml文件里的标签名称 比如把标签zer
  • NodeMcu arduino ESP8266WIFI 模块 例程 WIFIClienBasic(TCP服务器发送信息)

    NodeMcu arduino ESP8266WIFI 模块 WIFIClienBasic TCP服务器发送信息 流程 配置连接网络 发送TCP请求 获取接受数据打印 This sketch sends a string to a TCP
  • 【机器学习】LSTM 讲解

    2 LSTM 2 1 长期依赖问题 标准 RNN 结构在理论上完全可以实现将最初的信息保留到即使很远的时刻 但是在实践中发现 RNN 会受到短时记忆的影响 如果一条序列足够长 那它们将很难将信息从较早的时刻传送到后面的时刻 因此 如果正在尝