Keras ConvLSTM2D：输出层上的 ValueError

2024-02-07

我正在尝试训练 2D 卷积 LSTM 以根据视频数据进行分类预测。然而，我的输出层似乎遇到了问题：

“ValueError：检查目标时出错：预期dense_1 有 5 个维度，但得到了形状为 (1, 1939, 9) 的数组”

我当前的模型基于ConvLSTM2D 示例 https://github.com/keras-team/keras/blob/master/examples/conv_lstm.py由 Keras 团队提供。我认为上述错误是我误解该示例及其基本原理的结果。

Data

我有任意数量的视频，其中每个视频包含任意数量的帧。每帧尺寸为 135x240x1（颜色通道最后）。这会导致输入形状为 (None, None, 135, 240, 1)，其中两个“None”值依次是批量大小和时间步长。如果我用 1052 帧的单个视频进行训练，那么我的输入形状将变为 (1, 1052, 135, 240, 1)。

对于每一帧，模型应预测 9 个类别中 0 到 1 之间的值。这意味着我的输出形状是（无，无，9）。如果我用 1052 帧的单个视频进行训练，那么这个形状就会变成 (1, 1052, 9)。

Model

Layer (type)                 Output Shape              Param #
=================================================================
conv_lst_m2d_1 (ConvLSTM2D)  (None, None, 135, 240, 40 59200
_________________________________________________________________
batch_normalization_1 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
conv_lst_m2d_2 (ConvLSTM2D)  (None, None, 135, 240, 40 115360
_________________________________________________________________
batch_normalization_2 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
conv_lst_m2d_3 (ConvLSTM2D)  (None, None, 135, 240, 40 115360
_________________________________________________________________
batch_normalization_3 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
dense_1 (Dense)              (None, None, 135, 240, 9) 369
=================================================================
Total params: 290,769
Trainable params: 290,529
Non-trainable params: 240

源代码

model = Sequential()

model.add(ConvLSTM2D(
        filters=40,
        kernel_size=(3, 3),
        input_shape=(None, 135, 240, 1),
        padding='same',
        return_sequences=True))
model.add(BatchNormalization())

model.add(ConvLSTM2D(
        filters=40,
        kernel_size=(3, 3),
        padding='same',
        return_sequences=True))
model.add(BatchNormalization())

model.add(ConvLSTM2D(
        filters=40,
        kernel_size=(3, 3),
        padding='same',
        return_sequences=True))
model.add(BatchNormalization())

model.add(Dense(
        units=classes,
        activation='softmax'
))
model.compile(
        loss='categorical_crossentropy',
        optimizer='adadelta'
)
model.fit_generator(generator=training_sequence)

追溯

Epoch 1/1
Traceback (most recent call last):
  File ".\lstm.py", line 128, in <module>
    main()
  File ".\lstm.py", line 108, in main
    model.fit_generator(generator=training_sequence)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\legacy\interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\models.py", line 1253, in fit_generator
    initial_epoch=initial_epoch)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\legacy\interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 2244, in fit_generator
    class_weight=class_weight)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 1884, in train_on_batch
    class_weight=class_weight)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 1487, in _standardize_user_data
    exception_prefix='target')
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 113, in _standardize_input_data
    'with shape ' + str(data_shape))
ValueError: Error when checking target: expected dense_1 to have 5 dimensions, but got array with shape (1, 1939, 9)

批量大小设置为 1 时打印的示例输入形状为 (1, 1389, 135, 240, 1)。这个形状符合我上面描述的要求，所以我认为我的 Keras Sequence 子类（在源代码中为“training_sequence”）是正确的。

我怀疑这个问题是由我直接从 BatchNormalization() 转到 Dense() 引起的。毕竟，回溯表明问题发生在dense_1（最后一层）中。然而，我不想用我的初级知识让任何人误入歧途，所以请对我的评估持保留态度。

编辑 2018 年 3 月 27 日

看完之后这个线程 https://stackoverflow.com/a/49468183/4674553，其中涉及类似的模型，我更改了最终的 ConvLSTM2D 层，以便将 return_sequences 参数设置为 False 而不是 True。我还在 Dense 层之前添加了 GlobalAveragePooling2D 层。更新后的模型如下：

Layer (type)                 Output Shape              Param #
=================================================================
conv_lst_m2d_1 (ConvLSTM2D)  (None, None, 135, 240, 40 59200
_________________________________________________________________
batch_normalization_1 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
conv_lst_m2d_2 (ConvLSTM2D)  (None, None, 135, 240, 40 115360
_________________________________________________________________
batch_normalization_2 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
conv_lst_m2d_3 (ConvLSTM2D)  (None, 135, 240, 40)      115360
_________________________________________________________________
batch_normalization_3 (Batch (None, 135, 240, 40)      160
_________________________________________________________________
global_average_pooling2d_1 ( (None, 40)                0
_________________________________________________________________
dense_1 (Dense)              (None, 9)                 369
=================================================================
Total params: 290,769
Trainable params: 290,529
Non-trainable params: 240

这是回溯的新副本：

Traceback (most recent call last):
  File ".\lstm.py", line 131, in <module>
    main()
  File ".\lstm.py", line 111, in main
    model.fit_generator(generator=training_sequence)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\legacy\interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\models.py", line 1253, in fit_generator
    initial_epoch=initial_epoch)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\legacy\interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 2244, in fit_generator
    class_weight=class_weight)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 1884, in train_on_batch
    class_weight=class_weight)
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 1487, in _standardize_user_data
    exception_prefix='target')
  File "C:\Users\matth\Anaconda3\envs\capstone-gpu\lib\site-packages\keras\engine\training.py", line 113, in _standardize_input_data
    'with shape ' + str(data_shape))
ValueError: Error when checking target: expected dense_1 to have 2 dimensions, but got array with shape (1, 1034, 9)

我在这次运行中打印了 x 和 y 形状。 x 为 (1, 1034, 135, 240, 1)，y 为 (1, 1034, 9)。这可能会缩小问题范围。看起来问题与 y 数据有关，而不是与 x 数据有关。具体来说，密集层不喜欢时间暗淡。但是，我不确定如何纠正这个问题。

编辑 2018 年 3 月 28 日

于阳的解决方案奏效了。对于遇到类似问题并希望了解最终模型的任何人，以下是摘要：

Layer (type)                 Output Shape              Param #
=================================================================
conv_lst_m2d_1 (ConvLSTM2D)  (None, None, 135, 240, 40 59200
_________________________________________________________________
batch_normalization_1 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
conv_lst_m2d_2 (ConvLSTM2D)  (None, None, 135, 240, 40 115360
_________________________________________________________________
batch_normalization_2 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
conv_lst_m2d_3 (ConvLSTM2D)  (None, None, 135, 240, 40 115360
_________________________________________________________________
batch_normalization_3 (Batch (None, None, 135, 240, 40 160
_________________________________________________________________
average_pooling3d_1 (Average (None, None, 1, 1, 40)    0
_________________________________________________________________
reshape_1 (Reshape)          (None, None, 40)          0
_________________________________________________________________
dense_1 (Dense)              (None, None, 9)           369
=================================================================
Total params: 290,769
Trainable params: 290,529
Non-trainable params: 240

另外，源码：

model = Sequential()

model.add(ConvLSTM2D(
        filters=40,
        kernel_size=(3, 3),
        input_shape=(None, 135, 240, 1),
        padding='same',
        return_sequences=True))
model.add(BatchNormalization())

model.add(ConvLSTM2D(
        filters=40,
        kernel_size=(3, 3),
        padding='same',
        return_sequences=True))
model.add(BatchNormalization())

model.add(ConvLSTM2D(
        filters=40,
        kernel_size=(3, 3),
        padding='same',
        return_sequences=True))
model.add(BatchNormalization())

model.add(AveragePooling3D((1, 135, 240)))
model.add(Reshape((-1, 40)))
model.add(Dense(
        units=9,
        activation='sigmoid'))

model.compile(
        loss='categorical_crossentropy',
        optimizer='adadelta'
)

如果你想要每帧的预测，那么你一定应该设置return_sequences=True在你最后的ConvLSTM2D layer.

For the ValueError在目标形状上，替换GlobalAveragePooling2D()层与AveragePooling3D((1, 135, 240)) plus Reshape((-1, 40))使输出形状与您的目标数组兼容。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras ConvLSTM2D：输出层上的 ValueError 的相关文章

pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
Perl 是否有相当于 Python 的 `if __name__ == '__main__'` 的功能？

有没有一种方法可以确定当前文件是否是 Perl 源中正在执行的文件在 Python 中我们使用以下结构来做到这一点 if name main This file is being executed raise NotImplemente
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
在 iPython/pandas 中绘制多条线会生成多个图

我试图了解 matplotlib 的状态机模型但在尝试在单个图上绘制多条线时遇到错误据我了解以下代码应该生成包含两行的单个图 import pandas as pd import pandas io data as web aapl
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
计算 pyspark df 列中子字符串列表的出现次数

我想计算子字符串列表的出现次数并根据 pyspark df 中包含长字符串的列创建一个列 Input ID History 1 USA UK IND DEN MAL SWE AUS 2 USA UK PAK NOR 3 NOR NZE 4
python dicttoxml 多次使用相同的键

我正在尝试做如下所示的 xml
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
如何使用 Pandas Series 绘制两个不同长度/开始日期的时间序列？

我正在绘制每周总事件的几个熊猫系列对象系列中的数据events per week看起来像这样 Datetime 1995 10 09 45 1995 10 16 63 1995 10 23 83 1995 10 30 91 1995
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装

随机推荐

如何查找使用 NDK 编写的 C++ Android 应用程序的内存使用情况

我正在使用 NDK 将用 C 编写的游戏移植到 Android 我需要知道它运行时消耗了多少内存我正在寻找以编程方式查找用 C 编写的 Android 应用程序的内存使用情况这两个函数基于 JonnyBoy 的答案 static lon
如何使用 Roslyn 获取范围内的所有可见局部变量名称 (Microsoft CodeAnalysis)

请注意这与运行时反射元信息无关我正在编写 Roslyn CSharpSyntaxVisitor 的具体实现实施 VisitIdentifierName 时 public override SyntaxNode VisitIdenti
ASP.NET MVC 4 jQuery 验证脚本包不起作用

我最近升级了一个网站以使用 ASP NET MVC 4 并使用以下代码来呈现我的 jQuery 验证包但我收到以下错误 Microsoft JScript runtime error Object doesn t support prop
vim - C++ 构造函数初始化列表的缩进问题

我用的是vim 7 0 我希望以下代码按以下方式缩进初始化列表与构造函数的缩进相同 A A a1 10 a2 10 a3 10 根据 vim 帮助这可以通过设置来完成 set cino i0 但是这个设置会产生只有 a1 正确缩进 A
使用 addEventListener 时 setTimeout 出现问题

我有一个 vimeo 视频我想在单击按钮后播放 3 秒我可以让视频在点击时播放但我似乎无法在正确的位置获得 setTimeout 有什么建议吗 var iframe1 document getElementById prelearn
如何在 Android Studio 或 Visual Studio Code 中查找未使用的 flutter 类

由于客户对应用程序的需求变化很快我有近200个dart文件其中很多都没有使用除了手动一一搜索之外还有什么办法可以找到未使用的类吗在 Android Studio 中我可以通过使用检查代码功能找到未使用的 java 或 kot
ASP.NET MVC - 将 PartialView 与另一个对象一起返回到 Ajax

我正在使用 ASP NET MVC 编写一个单页 ajax 应用程序大量使用 jQuery 我在整个应用程序中执行类似以下操作 JS ajax type GET url Home GetSomePartialView data someA
在稀疏矩阵中取对数函数的有效方法

我有一个大的稀疏矩阵我要拿log4对于该稀疏矩阵中的所有元素我尝试使用numpy log 但它不适用于矩阵我也可以逐行取对数然后我用新的一排压碎旧的一排 Assume A is a sparse matrix Linked List
如何更改Android中Webview的字体？

我想将 webview 的默认字体更改为自定义字体我正在使用 webview 开发 Android 的双语浏览器应用程序我尝试通过将自定义字体放入资产中来获取自定义字体的实例但仍然无法将 webview 的默认字体设置为我的字体这是
获取触发 jquery Blur() 事件的单击对象[重复]

这个问题在这里已经有答案了假设我这样做 target blur function e do stuff 有没有办法获取被单击的对象以触发模糊操作我尝试使用e target 但这似乎返回附加到模糊操作的对象而不是单击的对象诀窍是等待额外
Java 用空格分隔字符串，不使用 [ ] 括号括起来

如果字符串没有被这种括号包围如何用空格分割字符串所以字符串 book new interesting book buy it 应该分为 book new interesting book buy it or book new inte
为什么 scalatest MockitoSugar 被弃用？

我是在 Scala 中编写 junit 测试的新手我正在使用 Mockito 来模拟对象我也在用scalatest 2 12 3 0 4 ScalaTest 文档例如here http www scalatest org user g
如何解决 Firefox 和 Chrome 之间的 CSS 填充问题？

已经在这几个小时了我一直在使用这个优秀的 UI 工具包 http getuikit com http getuikit com到目前为止一切都很棒问题是在 Chrome 和 Firefox 之间设置我的结果样式我设置了填充并在 Ch
如何避免类图中的循环关系

Hi I have a question about some circular relationships that I am facing with my database design I read a few more simila
在 VS 2012 中保存/导出单元测试结果

如何在 VS 2012 中导出单元测试结果我知道从来没有直接的方法可以做到这一点尽管应该有但至少在 2012 年我能够保存测试结果窗口中的结果并使用 trx2html 将它们转换为可读的内容在 2012 年我没有看到测试资源管理
Azure Databricks 和表单识别器 - 图像无效或受密码保护

我正在尝试使用 Databricks 自动化 Azure 表单识别器流程我会将 pdf 或 jpg 文件放入 blob 中并在 Databricks 中运行代码将文件发送到表单识别器执行数据识别并将结果放入 blob 中的新 csv
如何防止网站检测到 Fiddler

问题标题可能没有涵盖整个主题因为我做了很多研究并发现了许多奇怪的事情因此首先我想要实现的是某种代表用户工作的网站客户端不做任何非法的事情只是优化用户的一些工作流程我已经为很多网站这样做过效果很好然而目前的情况存在一个问题
如何选择 HTML5 画布形状？

我有一个 HTML5 画布在上面绘制了几个形状我想要发生的是当鼠标单击任何形状时应该选择该形状至少它可以告诉选择了哪种形状谢谢尝试使用现有的画布库或创建您自己的该库在选择形状时会发生事件下面的示例使用动力学 JS 库 h
Backbone.js 和 Require.js：不匹配的匿名 Define() 模块：function (_, Backbone) {

我刚开始使用 require js 并且将以下 app js 文件作为我的主干应用程序的一部分 require config baseUrl js paths jquery libs jquery 2 1 0 underscore libs
Keras ConvLSTM2D：输出层上的 ValueError

我正在尝试训练 2D 卷积 LSTM 以根据视频数据进行分类预测然而我的输出层似乎遇到了问题 ValueError 检查目标时出错预期dense 1 有 5 个维度但得到了形状为 1 1939 9 的数组我当前的模型基于ConvL

Keras ConvLSTM2D：输出层上的 ValueError

Keras ConvLSTM2D：输出层上的 ValueError 的相关文章

随机推荐

热门标签