reshape 的输入是一个具有 2 *“batch_size”值的张量，但请求的形状具有“batch_size”

2024-02-05

我想使用带有张量流后端的 Keras 顺序模型制作 RNN。当我实现以下代码时：

batch_size = 8
batch_inputshape = (batch_size,x_train.shape[1],x_train.shape[2])
print(batch_inputshape) #(8, 600, 103)

model = Sequential()
model.add(LSTM(103, 
               batch_input_shape = batch_inputshape, 
               return_sequences = True,
              stateful = True))
model.add(Dropout(0.2))

model.add(LSTM(50, 
               return_sequences = True,
              stateful = True))
model.add(Dropout(0.2))


model.add(TimeDistributed(Dense(10)))
model.add(TimeDistributed(Dense(2)))
model.add(Activation('softmax'))
model.compile(loss= ncce, optimizer='adam')    

print (model.output_shape) #(8, 600, 2)

model.fit(x_train,y_train, batch_size = batch_size,
                           nb_epoch = 1, validation_split=0.25)

我收到以下错误消息：

reshape 的输入是一个有 16 个值的张量，但请求的形状有 8 个

但无论我将batch_size更改为错误，都将遵循以下公式：

重塑的输入是一个张量2 * batch_size值，但要求的形状有batch_size

我看过其他的，但我认为它们对我帮助不大。或者我对答案的理解不够好。

任何帮助将非常感激！

编辑：根据要求输入和目标的形状：

print(x_train.shape) #(512,600,103)
print(y_train.shape) #(512,600,2)

EDIT 2:

from functools import partial
import keras.backend as K 
from itertools import product

def w_categorical_crossentropy(y_true, y_pred, weights):
    # https://github.com/fchollet/keras/issues/2115#issuecomment-274101310 #
    nb_cl = len(weights)
    final_mask = K.zeros_like(y_pred[:, 0])
    y_pred_max = K.max(y_pred, axis=1)
    y_pred_max = K.reshape(y_pred_max, (K.shape(y_pred)[0], 1))
    y_pred_max_mat = K.cast(K.equal(y_pred, y_pred_max), K.floatx())
    for c_p, c_t in product(range(nb_cl), range(nb_cl)):
        final_mask += (weights[c_t, c_p] * y_pred_max_mat[:, c_p] * y_true[:, c_t])
    return K.categorical_crossentropy(y_pred, y_true) * final_mask

w_array = np.ones((2,2))
w_array[1, 0] = 100


print(w_array)
ncce = partial(w_categorical_crossentropy, weights=w_array)
ncce.__name__ ='w_categorical_crossentropy

编辑 3：更新

在@Nassim Ben 的帮助下，他发现问题出在损失函数中。他发布了带有常规损失函数的代码，然后它就可以正常工作了。然而，对于自定义损失函数，该代码不起作用。正如这个问题的任何读者都可以看到的，我在上面发布了我的服装损失函数，并且存在问题。目前我还不知道为什么会出现这个错误，但这就是当前状态。

编辑：这段代码对我有用，为了简单起见我只改变了损失。

import keras
from keras.layers import *
from keras.models import Sequential
from keras.objectives import *
import numpy as np

x_train = np.random.random((512,600, 103))
y_train = np.random.random((512,600,2))
batch_size = 8
batch_inputshape = (batch_size,x_train.shape[1],x_train.shape[2]) 
print(batch_inputshape) #(8, 600, 103)

model = Sequential()
model.add(LSTM(103,
           batch_input_shape = batch_inputshape,
           return_sequences = True,
          stateful = True))
model.add(Dropout(0.2))
model.add(LSTM(50,
           return_sequences = True,
          stateful = True))
model.add(Dropout(0.2))


model.add(TimeDistributed(Dense(10)))
model.add(TimeDistributed(Dense(2)))
model.add(Activation('softmax'))
model.compile(loss= "mse", optimizer='adam')

print (model.output_shape) #(8, 600, 2)

model.fit(x_train,y_train, batch_size = batch_size,
                       nb_epoch = 1, validation_split=0.25)

EDIT 2:

所以错误来自损失函数。在您从 github 复制的 ncce 损失代码中，它们的输出形状为 (batch,10)。您的输出形状为 (batch, 600, 2)。这是我对该函数的编辑：

def w_categorical_crossentropy(y_true, y_pred, weights):
# https://github.com/fchollet/keras/issues/2115#issuecomment-274101310 #
    nb_cl = len(weights)
    # Create a mask with zeroes
    final_mask = K.zeros_like(y_pred[:,:,0])
    # get the maximum probability value for every output (shape = (batch,600,1))
    y_pred_max = K.max(y_pred, axis=2, keepdims=True)
    # Get the actual predictions for every output (shape = (batch,600,2))
    # This K.equal uses broadcasting, we compare two tensors of different sizes but it works (magic)
    y_pred_max_mat = K.equal(y_pred, y_pred_max)
    for c_p, c_t in product(range(nb_cl), range(nb_cl)):
        # Create the mask of weights to apply to the result of the cat_crossentropy
        final_mask += (weights[c_t, c_p] * K.cast(y_pred_max_mat[:,:, c_p], K.floatx()) * y_true[:,:, c_t])
    return K.categorical_crossentropy(y_pred, y_true) * final_mask

w_array = np.ones((2,2))
w_array[1, 0] = 100

正如你所看到的，由于你的特殊形状，我刚刚修改了索引玩法。掩模必须成形（批量，600）。最大值必须在第三维上完成，因为那里存在您想要输出的概率。由于张量的形状，构建最大值的矩阵乘法也需要更新。

这应该有效。

如果您需要更详细的解释，请随时询问:-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

stateful

reshape 的输入是一个具有 2 *“batch_size”值的张量，但请求的形状具有“batch_size” 的相关文章

如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
Python GTK + webkit - 在 gtk.main() 之后插入 JavaScript

我在终端中尝试了这个一切正常但是如果我在脚本内运行这个我无法在 gtk main 之后插入 JavaScript import gtk import webkit w gtk Window b webkit WebView w add
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
组和平均 NumPy 矩阵

假设我有一个任意的 numpy 矩阵如下所示 arr 6 0 12 0 1 0 7 0 9 0 1 0 8 0 7 0 1 0 4 0 3 0 2 0 6 0 1 0 2 0 2 0 5 0 2 0 9 0 4 0 3 0 2 0 1 0
Paramiko SSHException 通道已关闭

我一直在使用 Paramiko 在 Linux Windows 机器上发送命令它可以很好地在 Ubuntu 机器上远程执行测试但是它不适用于 Windows 7 主机以下是我收到的错误 def unit for event self
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
Pandas：将 pytz.FixedOffset 应用于系列

我有一个带有timestamp列看起来像这样 0 2020 01 26 05 00 00 08 00 1 2020 01 26 06 00 00 08 00 Name timestamp dtype datetime64 ns pytz F
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
根据第三个变量更改散点图中的标记样式

我正在处理多列字典我想绘制两列然后根据第三列和第四列更改标记的颜色和样式我很难改变 pylab 散点图中的标记样式我的方法适用于颜色不幸的是不适用于标记样式 x 1 2 3 4 5 6 y 1 3 4 5 6 7 m k l l
Selenium 不会在新选项卡中打开新 URL（Python 和 Chrome）

我想使用 Selenium WebDriver 和 Python 在不同的选项卡中打开相当多的 URL 我不确定出了什么问题 driver webdriver Chrome driver get url1 time sleep 5 driv
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 scipy 中创建新的发行版

我试图根据我拥有的一些数据创建一个分布然后从该分布中随机抽取这是我所拥有的 from scipy import stats import numpy def getDistribution data kernel stats gauss
Java/Python 中的快速 IPC/Socket 通信

我的应用程序中需要两个进程 Java 和 Python 进行通信我注意到套接字通信占用了 93 的运行时间为什么通讯这么慢我应该寻找套接字通信的替代方案还是可以使其更快更新我发现了一个简单的修复方法由于某些未知原因缓冲输出流似

随机推荐

play 2.4 中的插件、依赖项、模块和子项目有什么区别？

我是 playframework 的新手刚刚学习我对依赖项模块插件和子项目有点困惑它们有何不同这是我的理解可能是错的依赖项是播放应用程序运行所需的所有库子项目是另一个父应用程序内的播放应用程序不确定插件和模块
Rescue_from 不会从视图或助手中拯救 Timeout::Error

我的应用程序控制器中有一个 around filter 用于将所有操作封装在超时块中以便操作在达到 30 秒 Heroku 限制之前失败我还有一个rescue from Timeout Error 来彻底挽救这些超时不幸的是 resc
允许在 React Native 中关注 TextInput 时点击/按下项目

我有一个TextInput其功能是对某些结果进行搜索过滤结果显示在ScrollView 我遇到的问题是虽然国家focus on the TextInput 用户必须点击两次才能选择该项目这是一个TouchableOpacity 在里
Laravel 中的一次性自定义 cron 计划

我想在用户在表单中输入的自定义日期和时间运行一次 cron 做这个的最好方式是什么我发现可以像这样在 laravel 中安排自定义 cron gt cron 按照自定义 Cron 计划运行任务但我找不到时间格式的含义或者更简单可以
Numpy-convertible 类可以从序列内部正确转换为 ndarray？

The array 方法允许自定义类型自动转换为 numpy 例如 gt gt gt class Convertible def array self return np zeros 7 gt gt gt np array Converti
改变spacy NER中的beam_width

我想将 nlp entity cfg beam width 默认情况下为 1 更改为 3 我尝试了 nlp entity cfg update beam width 3 但看起来 nlp 的东西在这次更改后被破坏了如果我执行nlp str
如何为 IP 地址签署 SSL 证书？ [关闭]

Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案我有一台服务器在我家里的一台机器上仅托管我网站的节点后端我正在使用express 我想从另一个后端调用该服务器我们正在尝试构建一
Java（Android Studio）libgdx中的代码，如何计算弹丸[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 Java Android Studio libgdx中的代码当您单击触摸屏幕时如何计算圆形如球的射弹以及如何显示它就像打篮
电子邮件模板位置绝对吗？

使用安全吗position absolute在电子邮件模板中取决于您的用户使用的邮件客户端例如 Outlook 处理位置绝对好而 Thunderbird 则不然我会尝试将您的邮件模板设计得尽可能正常例如表格有很大帮助恶心
NamedScope 和垃圾收集

这个问题首先是在 Ninject Google Group 中提出的但我现在发现 Stackoverflow 似乎更活跃我使用 NamedScopeExtension 将相同的 ViewModel 注入到 View 和 Presente
具有多个间隔的序列

seq只能使用单个值by范围有没有办法矢量化by 即使用多个间隔像这样的事情 seq 1 10 by c 1 2 会回来c 1 2 4 5 7 8 10 现在可以使用例如来做到这一点seq 1 10 by 1 c T T F 因为这是
升级到 NPM 5.4.1 后，在不删除 node_modules 的情况下无法运行“npm install”

我已将 NPM 从 5 3 0 升级到 5 4 1 之后该命令似乎npm 安装仅当我删除后才有效节点模块当我尝试重新运行安装时收到以下错误消息之后如果我再次删除节点模块命令运行安装作品 once PS C source webs
iOS 通讯软件 SDK

我正在寻找在我当前的 iPhone android 应用程序中实现应用程序内消息程序要求是它必须免费实时并提供推送通知我已经研究过自己创建系统但注意到很多应用程序实现了非常相似的概念所以我认为 SDK 包装器可用以下是使用要实现
我可以在 Web 配置中设置应用程序池吗？

我使用 IIS 7 0 我想知道如何在 Web 配置文件中设置应用程序池我认为这是不可能的为您的应用程序选择应用程序池是一个设置问题而不是一个配置问题
jQuery Mobile 导航栏中每行超过 5 个项目

我未能成功地寻找一个变量来更改导航栏中单行中的最大项目数我刚刚开始使用 jQuery Mobile 尝试创建一个包含大约 7 个单字母项目的导航栏当存在超过 5 个项目时导航栏会自动换行这对于我的项目来说是不可取的谁能指出我的代码
简单的 Java Hangman 分配

我被困在一个类的 Java 作业中我们需要制作一个 Hangman 游戏但是一个非常基本的游戏这是 Java 类的介绍基本上我有一个由某人输入的单词另一个人必须猜测该单词但他们看不到该单词因此它会像这样显示如果该单词是 a
如何在我们的应用程序中给出 zend 库路径？（在 zend 框架 2.3 中）

我已经在本地计算机上安装了 zend 骨架应用程序我正在ubuntu上工作我是手动安装的没有使用composer 我已经在我的 httpd conf 中给出了 ZF2 PATH zend 库路径如下所示
如何比较 Django 中的两个日期时间字段

我用过datetime datetime now 用于存储datefield在我的模型中另存为2016 06 27 15 21 17 248951 05 30 现在我想比较一下datefield与datetime从前端获取的值例如Thu
是否可以使用 NumPy 重现 MATLAB 的 randn() ？

我想知道是否有可能准确地重现整个序列randn MATLAB 与 NumPy 的结合我用 Python Numpy 编写了自己的例程它给我的结果与其他人编写的 MATLAB 代码有些不同而且由于随机抽取不同我很难找出它的来源我已经
reshape 的输入是一个具有 2 *“batch_size”值的张量，但请求的形状具有“batch_size”

我想使用带有张量流后端的 Keras 顺序模型制作 RNN 当我实现以下代码时 batch size 8 batch inputshape batch size x train shape 1 x train shape 2 print b

reshape 的输入是一个具有 2 *“batch_size”值的张量，但请求的形状具有“batch_size”

reshape 的输入是一个具有 2 *“batch_size”值的张量，但请求的形状具有“batch_size” 的相关文章

随机推荐

热门标签