Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

2024-05-18

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型。训练集、测试集和验证集的变量名称是不言自明的。该数据集有 19 个类，因此网络的最后一层有 19 个输出。标签也是 one-hot 编码的。

nb_classes = 19
model1 = Sequential()
model1.add(Embedding(nb_words,
                     EMBEDDING_DIM,
                     weights=[embedding_matrix],
                     input_length=MAX_SEQUENCE_LENGTH,
                     trainable=False))
model1.add(LSTM(num_lstm, dropout=rate_drop_lstm, recurrent_dropout=rate_drop_lstm))
model1.add(Dropout(rate_drop_dense))
model1.add(BatchNormalization())
model1.add(Dense(num_dense, activation=act))
model1.add(Dropout(rate_drop_dense))
model1.add(BatchNormalization())

model1.add(Dense(nb_classes, activation = 'sigmoid'))


model1.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
#One hot encode all labels
ytrain_enc = np_utils.to_categorical(train_labels)
yval_enc = np_utils.to_categorical(val_labels)
ytestenc = np_utils.to_categorical(test_labels)

model1.fit(train_data, ytrain_enc,
             validation_data=(val_data, yval_enc),
             epochs=200,
             batch_size=384,
             shuffle=True,
             verbose=1)

在第一个纪元之后，这给了我这些输出。

Epoch 1/200
216632/216632 [==============================] - 2442s - loss: 0.1427 - acc: 0.9443 - val_loss: 0.0526 - val_acc: 0.9826

然后我在测试数据集上评估我的模型，这也显示了大约 0.98 的准确度。

model1.evaluate(test_data, y = ytestenc, batch_size=384, verbose=1)

然而，标签是一次性编码的，所以我需要类的预测向量，以便我可以生成混淆矩阵等。所以我使用，

PREDICTED_CLASSES = model1.predict_classes(test_data, batch_size=384, verbose=1)
temp = sum(test_labels == PREDICTED_CLASSES)
temp/len(test_labels)
0.83

这表明总预测类别的准确率为 83%model1.evaluate显示 98% 的准确率！我在这里做错了什么？我的损失函数适合分类类别标签吗？我的选择是sigmoid预测层的激活函数好吗？或者 keras 评估模型的方式有差异？请提出可能出现问题的建议。这是我第一次尝试制作深度模型，所以我对这里的问题不太了解。

我已经找到问题了。metrics=['accuracy']根据成本函数自动计算准确性。所以使用binary_crossentropy显示二进制准确性，而不是分类准确性。使用categorical_crossentropy自动切换到分类精度，现在与使用手动计算相同model1.predict()。 Yu-Yang正确地指出了多类问题的成本函数和激活函数。

P.S：可以通过使用获得分类精度和二进制精度metrics=['binary_accuracy', 'categorical_accuracy']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异的相关文章

PyTorch LSTM 中的“隐藏”和“输出”有什么区别？

我无法理解 PyTorch 的 LSTM 模块以及类似的 RNN 和 GRU 的文档关于输出它说输出输出 h n c n 输出 seq len batch hidden size num directions 包含RNN最后一层的
LSTM 和 CNN：ValueError：检查目标时出错：预期 time_distributed_1 有 3 个维度，但得到形状为 (400, 256) 的数组

我要申请CNN and LSTM在我的数据上我只选择一小部分数据我的训练数据大小是 400 50 我的测试数据是 200 50 仅使用 CNN 模型它可以正常工作没有任何错误只是在添加 LSTM 模型时出现了很多错误 model
简单 CAE 的问题

看起来简单的 CAE 不适用于 Carvana 数据集我正在尝试对 Carvana 数据集进行简单的 CAE 你可以下载它here https www kaggle com c carvana image masking challeng
Theano导入错误

我正在尝试在 CPU 机器上安装 Theano 运行 intel HD 显卡没有 NVIDIA 在 python 中测试时出现以下导入错误 WARNING theano configdefaults g not detected Thea
TensorFlow 运算符重载

有什么区别 tf add x y and x y 在 TensorFlow 中当您使用以下命令构建图表时您的计算图表会有什么不同代替tf add 更一般地说有或者其他张量超载的操作如果至少有一个x or y is a tf Te
分类报告 - 精度和 F 分数定义不明确

我从 sklearn metrics 导入了classification report 当我输入我的np arrays作为参数我收到以下错误 usr local lib python3 6 dist packages sklearn met
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
Keras 中批量大小可变的batch_dot

我正在尝试编写一个层来合并 2 个张量formula https i stack imgur com I49aj png x 0 和x 1 的形状都是 1 500 M是500 500的矩阵我希望输出为 500 500 我认为这在理论上是可
Caffe 多输入图像

我正在考虑实现一个 Caffe CNN 它接受两个输入图像和一个标签后来可能是其他数据并且想知道是否有人知道 prototxt 文件中执行此操作的正确语法它只是一个带有额外顶部的 IMAGE DATA 层吗或者我应该为每个层使用单独
model.fit 在 Keras 中如何工作？

我之前的帖子或错误是这样的one https stackoverflow com questions 52261090 do the operations defined in array ops in tensorflow have gr
按相似度对矩阵进行排序

我有 100 个矩阵其中每一行对应一个个体列对应站点我想通过相似性度量对行进行排序以便最相似的个体在矩阵中彼此相邻我使用 k 近邻按行对矩阵进行排序并将这些排序的矩阵提供给卷积神经网络我想知道是否还有其他措施可以完成手头的任务
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
Keras model.summary() 结果 - 了解参数数量

我有一个简单的神经网络模型用于使用 Keras Theano 后端从用 python 编写的 28x28px 图像中检测手写数字 model0 Sequential number of epochs to train for nb ep
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
使用 TensorFlow 和 Keras 的卷积神经网络精度较低 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我计划创建一个 CNN 来预测蘑菇类型并从互联网上收集了 2500 多张照片数据集有 156 个类别不同类型的蘑菇我在 Tensorfl
UnimplementedError：图形执行错误：在张量流上运行 nn

我一直遇到这个错误我不知道为什么特别是因为我完全遵循某人的代码并且该人在运行此错误时没有错误 img shape 128 128 3 load pretrained model base model tf keras applicati
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
Keras conv1d 层参数：过滤器和 kernel_size

我对 keras 的 conv1d 层中的这两个参数感到非常困惑 https keras io layers convolutional conv1d https keras io layers convolutional conv1d 文
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1

随机推荐

在 Dynamics CRM 插件中访问电子邮件发件人地址

我正在编写一个 Dynamics CRM 2011 插件该插件挂钩到电子邮件实体的更新后事件阶段 40 pipeline http msdn microsoft com en us library gg327941 aspx 并且在此阶
模块“””在 ionic 3 Geolocation 中没有导出成员“NativeGeocoderReverseResult”

模块没有导出成员 NativeGeocoderReverseResult L13 从 ionic native geolocation ngx 导入 Geolocation L14 导入 NativeGeocoder NativeGeoc
WCF：将随机数添加到 UsernameToken

我正在尝试连接到用 Java 编写的 Web 服务但有些东西我无法弄清楚使用 WCF 和 customBinding 几乎一切似乎都很好除了 SOAP 消息的一部分因为它缺少 Nonce 和 Created 部分节点显然我错过了一
如何在查询语句之外从mysql查询中获取值？

这是下面的函数console log function quo value value connection query SELECT role from roles where id 1 function error results fi
REST URI 和对象上的操作，可以进行评论、标记、评级等

我正在为我的公司研究一种 Web API 看起来我们可能会实现一个 RESTful API 我现在已经阅读了几本关于此的书籍 O Reilly 的 RESTful Web 服务似乎最有用并为可以评论标记和评级的对象提出了以下一组 UR
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
R.java是手动修改的！恢复到生成的版本

我在布局中添加了一个 xml 文件之后这个错误就来了但问题是我还没有接触过 R java 文件现在在我的新活动中我要将其内容视图设置为我新创建的 xml 文件但是当我执行 R layout 时新创建的 xml 不会出现在建议中
OutputCache 因复杂对象属性而异

我有一个控制器操作它接收一个复杂对象作为参数我需要 OutputCache 根据该复杂对象的属性之一而变化这可能吗如何如果你有一个像这样的模型 public class person public string Name get
当当前分支上有未提交的更改时签出另一个分支

大多数时候当我尝试签出另一个现有分支时如果我在当前分支上有一些未提交的更改 Git 会不允许我这样做所以我必须首先提交或隐藏这些更改然而有时 Git 确实允许我在不提交或存储这些更改的情况下签出另一个分支并且它会将这些更改携带到
我在函数的最后一次递归调用中得到“方案应用程序而不是过程”

所以这是代码 define time prime test n newline display n start prime test n runtime define start prime test n start time if pri
直接从一个通道发送到另一个通道

当从一个通道直接发送到另一个通道时我偶然发现了令人惊讶的行为 package main import fmt func main my chan make chan string chan of chans make chan chan
Sitecore ECM 时事通讯：当单击“调度和测试”按钮时，ECM 会为消息内的链接生成不同的值

我有 ECM NewsLetter 其中包含一些网站链接另一个项目当我通过单击发送按钮将此新闻通讯发送到我的电子邮件时当我从电子邮件收件箱中单击链接时链接不起作用它显示 404 未找到错误但在 ECM 中如果我单击测试
C - 直接从键盘缓冲区读取

这是C语言中的一个问题如何直接读取键盘缓冲区中的数据我想直接访问数据并将其存储在变量中变量应该是什么数据类型我需要它用于我们研究所目前正在开发的操作系统它被称为 ICS OS 我不太清楚具体细节它在 x86 32 位机器上运行
有没有办法禁用 .NET 标签的“双击复制”功能？

这真的很烦人我使用标签作为列表项用户控件的一部分用户可以单击它来选择列表项然后双击它来重命名它但是如果剪贴板中有名称双击标签会将其替换为标签文本我还检查了应用程序中的其他标签双击它们也会将其复制到剪贴板我没有在这个程序中编
安装 Python 3.5 包“socket”pycharm 时出错

仅使用 PyCharm 或命令提示符无法安装此软件包 Collecting socket Using cached socket 0 5 tar gz Complete output from command python setup py
Spark：查找前 n 个值的高性能方法

我有一个很大的数据集我想找到具有 n 个最高值的行 id count id1 10 id2 15 id3 5 我能想到的唯一方法是使用row number没有分区就像 val window Window orderBy desc coun
使用 ruby 调整动画 GIF 图像的大小？

我正在尝试将 GIF 图像调整为不同的尺寸我在 ruby 中使用 RMagick 库但对于某些 gif 图像即使我缩小 GIF 的大小文件大小似乎也会增加我正在以相同的纵横比调整图像图像的大小这是我的代码 require rma
如何在 Angular 4 中的 HTML 中包含或排除属性

我正在使用 Angular 4 和 Angular 材料来构建一张桌子我想要mat sort header有条件地添加到以下模板中
为什么范围为“provided”的依赖项会隐藏 Maven 中的传递依赖项？

我的 Maven 项目中有三个模块这稍微简化了 model包含JPA注释的实体类坚持实例化一个实体管理器并调用它的方法应用创建类的实例model 设置一些值并将它们传递给坚持 model and 坚持显然取决于javax persis
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m

Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异 的相关文章

随机推荐

热门标签

Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异的相关文章