Keras LSTM层return_sequences参数的坑

2023-10-31

具体用法我就不赘述了，可以参考中文文档https://keras.io/zh/layers/recurrent/#lstm

我主要记录一下坑，网络结构如下：

model = Sequential()
model.add(Embedding(257, 150, weights=[embedding_matrix], input_length=X.shape[1], trainable=False))
model.add(SpatialDropout1D(0.55))
# return_sequences: 布尔值。是返回输出序列中的最后一个输出，还是全部序列,默认false。
model.add(LSTM(128, dropout=0.2, recurrent_dropout=0.2, input_shape=(1600, 150), return_sequences=True))
model.add(Dense(32))
# model.add(Dense(2, activation='softmax'))
model.add(Dense(1, activation='sigmoid'))

因为上面网络中LSTM层 return_sequences设置为True，表示返回全部时间序列，而不是仅仅最后一个，导致经过全连接层Dense输出后是一个矩阵而不是一个向量，与标签（二分类，标签为0或1）不匹配，但最坑的一点是竟然不报错，而且还能训练。这是之前的网络结果：

之前一直没咋关注最后一层的output shape不是1，而是1600*1，直到我预测的时候，调用model.predict()的时候才发现不太对，白白训练了。

这是100个样本predict的结果，本来预期是100个0或1标签结果是100个1600*1的矩阵。

令该参数为False后output shape就正常了：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLP

深度学习

tensorflow

Keras LSTM层return_sequences参数的坑的相关文章

LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
缩短文本并仅保留重要句子

德国网站 nandoo net 提供了缩短新闻文章的可能性如果使用滑块更改百分比值文本会发生变化并且某些句子会被遗漏您可以在这里看到它的实际效果 http www nandoo net read article 299925 http
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
无法将大小为 1665179 的数组重塑为形状 (512,512,3,3)

该脚本用于进行检测权重文件是 yolov4 coco 预训练模型可以在这里找到 https drive google com file d 1cewMfusmPjYWbrnuJRuKhPMwRe b9PaT view https dri
Keras 通过设置种子获得不同的结果[重复]

这个问题在这里已经有答案了在keras中每次运行都有很高的方差和不稳定的性能为了解决这个问题根据https keras io getting started faq how can i obtain reproducible res
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
没有带有张量板的图表

我正在读一本关于 Tensorflow 的书我发现了这段代码 from future import absolute import from future import division from future import print
如何在google colab中降级到tensorflow-gpu版本1.12

我正在运行一个仅与旧版本的tensorflow GPU兼容的GAN 因此我需要将google colab中的tensorflow gpu从1 15降级到1 12 我尝试使用本中建议的以下命令thread https stackoverflo
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
除非 POS 显式，否则 WordNetLemmatizer 不会返回正确的引理 - Python NLTK

我正在对 Ted 数据集成绩单进行词形还原我注意到一些奇怪的事情并非所有单词都被词形还原要说的是 selected gt select 哪个是对的然而 involved gt involve and horsing gt horse
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
错误：分配具有形状的张量时出现 OOM

在使用 Apache JMeter 进行性能测试期间我面临着初始模型的问题错误分配形状为 800 1280 3 和类型的张量时出现 OOM 通过分配器浮动在 job localhost replica 0 task 0 device
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im

随机推荐

vue2.0 vue3.0 input组件封装

vue2
tar -xf node-v12.16.1-linux-armv7l.tar.xz 错误

1 tar解压tar xz能会出错因为你的系统里没有对应的解压工具你安装上xz和tar对应工具包就行 apt get install xz utils 2 chmod无法访问没有那个文件或目录方案之一修改 etc selinux
UEFI模式安装下Ubuntu 18.04 系统分区参考（win10+Ubuntu双系统）

由于这几天给自己的电脑成功装了双系统所以在此记录下当时在装Ubuntu系统中最难懂的部分系统分区以供大家以及自己今后参考具体安装步骤我就不一一细说了可以参考其他博主的文章小米笔记本安装Win10 Ubuntu16 04 LTS
金山卫士开源软件之旅(二) 简单教程：如何创建一个基于金山卫士界面库的工程

完整解决方案代码压缩包 test full zip 267 59 KB 参考 http bbs code ijinshan com thread 1391 1 1 html 为了让更多的朋友能够让自己的程序使用上金山卫士的界面库现将创建界
oracle case when的使用方法

大家都知道Case when的用法一旦满足了某一个WHEN 则这一条数据就会退出CASE WHEN 而不再考虑其他CASE 文章来详细的介绍了case when的用法并举例说明了 Case when 的用法简单Case函数简单CASE
C++ 接口（抽象类）

C 接口是使用抽象类来实现的接口描述了类的行为和功能而不需要完成类的特定实现且抽象类与数据抽象互不混淆如果类中至少有一个函数被声明为纯虚函数则这个类就是抽象类数据抽象则是一个把实现细节与相关的接口分离开的概念如果类中至少有一个
Ubuntu18.04安装ROS教程bug解决办法

Ubuntu18 04安装ROS教程bug解决办法写在前面一配置源文件bug 二 rosdep update 报错三安装ROS中出现bash opt ros melodic setup bash 没有那个文件或目录或者bash o
linux设置时间为24小时制，设置时区

1 查看系统时间 root localhost localdomain date Thu Feb 4 14 24 18 CST 2010 时区是CST 为了彻底弄明白GMT UTC CST 我查阅了下网上的相关教程进行整理一般来说 UT
Android 应用内部存储之应用文件缓存

前言 Android 应用内部存储之应用文件缓存的重点在最后总结如果想快速学习直接查看最后总结在向手机上保存数据一般是把数据保存在sdcard中的大部分应用是直接在sdcard的根目录下创建一个文件夹然后把数据保存在该文件夹中
一个TCP长连接设备管理后台工程(四)---jtt808协议解析

协议解析从前面内容我们可以发现 808协议是一个很典型的协议格式固定字段变长字段其中固定字段用来检测一个帧格式的完整性和有效性所以一般会包含一下内容帧头变长字段对应的长度校验由于这一段的数据格式固定目的单一所以处理起来
vue/react/node项目通过eslint检查语法规范

首先我们打开终端全局安装依赖 npm install g eslint 然后以管理员身份运行项目终端输入 eslint init 然后这里在初始化时会问我们想如何使用它分别对应仅检查语法检查语法并发现问题检查语法发现问
面试官：为啥索引可以让查询变快？

您好我是路人更多优质文章见个人博客 http itsoku com 概述人类存储信息的发展历程大致经历如下由于是个人凭着自己理解总结的因此可能不一定精确但是毋庸置疑的是在当代各大公司机构部门的数据都是维护在数据库当中的数据
如何在Kubernetes中安装metrics-server以获取Node节点、Pod容器资源监控指标?

关注 WeiyiGeek 公众号设为特别关注每天带你玩转网络安全运维应用开发物联网IOT学习本章目录 Kubernetes中安装metrics server以获取客户端资源监控指标原文地址 https blog weiyige
系统分析师笔记

信息系统生命周期 1 立项阶段企业全局形成概念需求分析 2 开发阶段系统规划系统分析系统设计系统实施系统验收 3 运维阶段通过验收和移交之后 4 消亡阶段更新改造功能扩展报废重建 1 系统规划初步调查分析系统目标
bash设置成vim命令模式

如果你习惯在vim下编辑文件或者写代码那么对Vim命令肯定很熟悉自然希望在bash输入命令的时候也能够使用这些命令使得shell命令输入也便利起来默认情况下 bash是Emacs模式的在 bashrc里面添加一个设置 set o
python的name属性_Python中__name__属性的妙用

在Python中每一个module文件都有一个built in属性 name 这个 name 有如下特点 1 如果这个module文件是被别的文件导入的那么该 name 属性的值就是这个module文件的名字 2 如果这个module
elastic-job开源框架使用中遇到的架包冲突错误

最近在运行部门一个新的框架该框架是用maven管理jar包的聚合工程在进行运行elastic job相关的一个子项目时报了如下的错误 Exception in thread main org springframework beans
使用Django开发一个简易的留言板

Django在线留言板demo 环境 ubuntu16 04 python3 django1 11 1 创建项目 django admin py startproject message 进入项目message 2 创建APP python
伪代码和流程图

一逻辑是写代码的基础逻辑是什么三段论命题一 JS中所有函数都是由function构造的命题二 Function Object Array 推论 Function Object Array是由Function构造的二用三种语句表
Keras LSTM层return_sequences参数的坑

具体用法我就不赘述了可以参考中文文档https keras io zh layers recurrent lstm 我主要记录一下坑网络结构如下 model Sequential model add Embedding 257 150

Keras LSTM层return_sequences参数的坑

Keras LSTM层return_sequences参数的坑 的相关文章

随机推荐

热门标签

Keras LSTM层return_sequences参数的坑的相关文章