ValueError：lstm 层的输入 0 与该层不兼容：预期 ndim=3，发现 ndim=2。收到完整形状：[无，18]

2023-12-09

我是 Keras 新手，我正在尝试构建一个供个人使用/未来学习的模型。我刚刚开始使用 python，并想出了这段代码（在视频和教程的帮助下）。我有 16324 个实例的数据，每个实例由 18 个特征和 1 个因变量组成。

import pandas as pd
import os
import time
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, LSTM, BatchNormalization
from tensorflow.keras.callbacks import TensorBoard, ModelCheckpoint

EPOCHS = 10
BATCH_SIZE = 64
NAME = f"-TEST-{int(time.time())}"

df = pd.read_csv("EntryData.csv", names=['1SH5', '1SHA', '1SA5', '1SAA', '1WH5', '1WHA', '2SA5', '2SAA', '2SH5', '2SHA', '2WA5', '2WAA', '3R1', '3R2', '3R3', '3R4', '3R5', '3R6', 'Target'])

df_val = 14554 

validation_df = df[df.index > df_val]
df = df[df.index <= df_val]

train_x = df.drop(columns=['Target'])
train_y = df[['Target']]
validation_x = validation_df.drop(columns=['Target'])
validation_y = validation_df[['Target']]

model = Sequential()
model.add(LSTM(128, input_shape=(train_x.shape[1:]), return_sequences=True))
model.add(Dropout(0.2))
model.add(BatchNormalization())

model.add(LSTM(128, return_sequences=True))
model.add(Dropout(0.1))
model.add(BatchNormalization())

model.add(LSTM(128))
model.add(Dropout(0.2))
model.add(BatchNormalization())

model.add(Dense(32, activation='relu'))
model.add(Dropout(0.2))

model.add(Dense(2, activation='softmax'))

opt = tf.keras.optimizers.Adam(lr=0.001, decay=1e-6)

model.compile(loss='sparse_categorical_crossentropy',
              optimizer=opt,
              metrics=['accuracy'])

tensorboard = TensorBoard(log_dir=f'logs/{NAME}')

filepath = "RNN_Final-{epoch:02d}-{val_acc:.3f}"  
checkpoint = ModelCheckpoint("models/{}.model".format(filepath, monitor='val_acc', verbose=1, save_best_only=True, mode='max')) # saves only the best ones

history = model.fit(
    train_x, train_y,
    batch_size=BATCH_SIZE,
    epochs=EPOCHS,
    validation_data=(validation_x, validation_y),
    callbacks=[tensorboard, checkpoint],)

score = model.evaluate(validation_x, validation_y, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

model.save("models/{}".format(NAME))

In line

model.add(LSTM(128, input_shape=(train_x.shape[1:]), return_sequences=True))

抛出一个错误：

ValueError：lstm 层的输入 0 与该层不兼容：预期 ndim=3，发现 ndim=2。收到完整形状：[无，18]

我在这个网站和谷歌上搜索解决方案几个小时了，但我无法找到正确的答案，或者我无法实现类似问题的解决方案。

感谢您的任何提示。

LSTM 网络期望三维输入这种格式的：

(n_samples, time_steps, features)

这可能有两种主要方式造成问题。

您的输入是二维的
您堆叠了（多个）LSTM 层

1.您的输入是二维的

您需要将输入转换为 3D。

x = x.reshape(len(x), 1, x.shape[1])
# or
x = np.expand_dims(x, 1)

然后，在第一层中指定正确的输入形状：

LSTM(64, input_shape=(x.shape[1:]))

2. 你有堆叠的 LSTM 层

默认情况下，LSTM 层将not返回序列，即它们将返回 2D 输出。这意味着第二个 LSTM 层将没有所需的 3D 输入。为了解决这个问题，您需要设置return_sequences=True:

tf.keras.layers.LSTM(8, return_sequences=True),
tf.keras.layers.LSTM(8)

以下是重现和解决 2D 输入问题的方法：

import tensorflow as tf
import numpy as np

x = np.random.rand(100, 10)
# x = np.expand_dims(x, 1) # uncomment to solve the problem
y = np.random.randint(0, 2, 100)

model = tf.keras.Sequential([
    tf.keras.layers.LSTM(8),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

history = model.fit(x, y, validation_split=0.1)

以下是重现和解决堆叠 LSTM 层问题的方法：

import tensorflow as tf
import numpy as np

x = np.random.rand(100, 1, 10)
y = np.random.randint(0, 2, 100)

model = tf.keras.Sequential([
    tf.keras.layers.LSTM(8), # use return_sequences=True to solve the problem
    tf.keras.layers.LSTM(8),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

history = model.fit(x, y, validation_split=0.1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

neuralnetwork

LSTM

ValueError：lstm 层的输入 0 与该层不兼容：预期 ndim=3，发现 ndim=2。收到完整形状：[无，18] 的相关文章

如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
scipy.misc.imshow RuntimeError('无法执行图像视图')

我正在测试scipy misc imshow https docs scipy org doc scipy 0 15 1 reference generated scipy misc imshow html我得到了运行时错误无法执行图像查
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
如何可视化多维数据上的 kmeans 聚类

我在 mnist 数据集上使用 kmeans 聚类算法并希望可视化聚类后的图到目前为止我做了这个 from mnist import MNIST mndata MNIST Datasets X train y train mndata
Scrapy 抓取并跟踪 href 中的链接

我对 scrapy 很陌生我需要从 url 的主页跟踪 href 到多个深度再次在 href 链接内我有多个 href 我需要遵循这些href 直到到达我想要抓取的页面我的页面的示例 html 是初始页 div class page
Pip 突然使用了错误版本的 Python

在 os x 上使用 pip 时遇到一个奇怪的问题据我所知快速查看我的 bash history 似乎可以确认我最近没有对我的配置进行任何更改唉 pip 命令似乎突然使用了与以前不同的 python 版本到目前为止我使用命令 p
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev

随机推荐

视差滚动不适用于移动 CSS

我的视差滚动不适用于移动设备 Android 和 iOS 该代码适用于桌面设备但不适用于移动设备无论是任何浏览器背景图像不会以视差效果滚动你可以在这里查看https dkpyk75z6sfdo cloudfront net 这是 C
使用 URLRequestConvertible 的单元测试中出现链接错误

我在为一个非常简单的函数编写简单的单元测试 Xcode 7 2 时遇到一个奇怪的问题该函数确保将参数添加到 URL func appendToken token String toRequest request URLRequestCon
如何使用 PHP 将 AVI 文件转换为 FLV 格式？

是否可以使用 PHP 将 AVI 文件转换为 FLV 格式如果是这样怎么办我不需要完整的解决方案只需要有关如何执行此操作的提示 ffmpeg是一个很棒的图书馆以下是该过程的演练 http vexxhost com blog 200
在VBA中使用ADO连接到PostgreSQL

我无法找到使用 VBA ADO 从 Excel 连接到 PostgreSQL 数据库的清晰可靠的示例诚然我是 VBA 新手大多数示例和教程都非常以 Access 或 MSSQL 为中心我主要使用 Ruby Rails Perl 和
如何在 R 中按州创建分层样本

如何使用采样包在 R 中创建分层样本我的数据集有 355 000 个观察值该代码直到最后一行都运行良好下面是我编写的代码但我总是收到以下消息 sort list y 中的错误 x 对于 sort list 必须是原子的您是否在
为什么“instanceof”运算符在传递给库的实例上返回 false？（不涉及继承）

我正在用 TS 建立一个图书馆该库使用ssh2库作为依赖项我正在尝试创建一个可以接受ssh2配置对象或已经存在的Client执行命令的实例这是一个简化的情况 import Client ConnectConfig from ssh2
Chrome 渲染问题。体内带有 UL 的固定位置锚

使用以下代码时 Google Chrome 和 Opera 存在渲染问题为什么 div a href s1 Link 1 a br a href s2 Link 2 a div div div
接触外国安全负责人

正在寻找用户 email protected 与 objectSidS 1 5 21 1234567890 123465789 123456789 123456 我只找到一个国外安全负责人CN S 1 5 21 1234567890 123
使用数据列表进行多项选择

我正在使用该标签为我的搜索框创建建议列表但我无法从数据列表中选择多个值目前我的 HTML 是
将键值对传递给 JavaScript 文件

您可以将键值对传递给 JavaScript 文件吗该技术由脚本性的 see line 54 您可以通过检查源来实现这一点script在你的页面上的元素中我给你留下了一个独立于框架的功能 function getScriptVariabl
推送通知在 iOS 10 中不显示

如何在 iOS 10 中获取通知在以前的版本中我可以在以下位置收到通知func application application UIApplication didReceiveRemoteNotification userInfo NS
C++ 重载决策、转换运算符和 const

在这种情况下 void f int void f const int int i f i 情况非常清楚 f int 被调用这似乎是正确的但是如果我有这个这是错误地完成的 class aa public operator bool c
delegate 类似于 mvc 控制器吗？

我看到了这篇文章 http www cimgf com 2008 10 01 cocoa touch tutorial iphone application example 委托控制器委托和控制器这两个词可以同义使用我不确定他在说什么
如何从 Ruby 运行 Excel 宏？

Problem 我有这本十多年前的 Excel 工作簿其中有无数行 VBA 代码其中一些我必须更新所以我有了用 Ruby 编写单元测试的疯狂想法 Question 如何从 Ruby 调用 Excel 宏到目前为止我所拥有的 I ha
这个 State monad 代码是如何工作的？

这段代码来自于此article 我一直能够遵循它直到这一部分 module Test where type State Int data ST a S State gt a State apply ST a gt State gt a St
为什么我的 div 边距重叠以及如何修复它？

我不明白为什么这些 div 的边距重叠 alignright float right header social margin top 50px header social a display inline block header soc
如何异步触发JProgressBar？

我有一个JButton swing 在里面JPanel 如果按下它我将在其列表中的 for 循环上执行任务EDT thread 这样做时我需要更新JProgressBar 问题是当我按下 JButton 时任务是在事件调度线程 EDT
如果我第二天打开应用程序，Firestore 是否会再次收取文档读取费用？

我没有找到任何解决方案来避免使用 get 时从服务器读取数据但是我可能找到了解决方案但我不清楚它是否有效我发现在使用实时功能时客户端会随着数据的变化而不断更新所以根据我的理解如果服务器上没有任何更改则不会收取任何读取费用对
从受密码保护的 Access 数据库进行 Excel VBA 查询

我目前正在尝试从 Microsoft Access 数据库 mdb 查询其中一个表但是当我尝试执行SELECT FROM myTable 它给出用户定义类型未定义我可以知道为什么吗这是我的示例代码 Private Sub Comm
ValueError：lstm 层的输入 0 与该层不兼容：预期 ndim=3，发现 ndim=2。收到完整形状：[无，18]

我是 Keras 新手我正在尝试构建一个供个人使用未来学习的模型我刚刚开始使用 python 并想出了这段代码在视频和教程的帮助下我有 16324 个实例的数据每个实例由 18 个特征和 1 个因变量组成 import pand

ValueError：lstm 层的输入 0 与该层不兼容：预期 ndim=3，发现 ndim=2。收到完整形状：[无，18]

ValueError：lstm 层的输入 0 与该层不兼容：预期 ndim=3，发现 ndim=2。收到完整形状：[无，18] 的相关文章

随机推荐

热门标签