张量流 model.evaluate 和 model.predict 非常不同的结果

2024-01-09

我正在构建一个简单的 CNN 用于二值图像分类，并且从 model.evaluate() 获得的 AUC 远高于从 model.predict() + roc_auc_score() 获得的 AUC.

整个笔记本是here https://github.com/pro100olga/dlaicourse/blob/master/evaluate_predict.ipynb.

编译模型并输出 model.fit()：

model.compile(loss='binary_crossentropy',
              optimizer=RMSprop(lr=0.001),
              metrics=['AUC'])

history = model.fit(
      train_generator,
      steps_per_epoch=8,  
      epochs=5,
      verbose=1)

纪元 1/5 8/8 [================================] - 21s 3s/步 - 损失：6.7315 - auc：0.5143

纪元 2/5 8/8 [================================] - 15s 2s/步 - 损失：0.6626 - auc：0.6983

纪元 3/5 8/8 [================================] - 18s 2s/步 - 损失：0.4296 - auc：0.8777

纪元 4/5 8/8 [================================] - 14s 2s/步 - 损失：0.2330 - auc：0.9606

纪元 5/5 8/8 [================================] - 18s 2s/步 - 损失：0.1985 - auc：0.9767

然后 model.evaluate() 给出类似的东西：

model.evaluate(train_generator)

9/9 [================================] - 10s 1s/步 - 损失：0.3056 - auc：0.9956

但直接从 model.predict() 方法计算出的 AUC 会低两倍：

from sklearn import metrics

x = model.predict(train_generator)
metrics.roc_auc_score(train_generator.labels, x)

0.5006148007590132

我读过几篇关于类似问题的帖子（比如this https://stackoverflow.com/questions/57212021/getting-different-results-from-keras-model-evaluate-and-model-predict, this https://stackoverflow.com/questions/44476706/what-is-the-difference-between-keras-model-evaluate-and-model-predict, this https://stackoverflow.com/questions/49903706/keras-predict-gives-different-error-than-evaluate-loss-different-from-metrics并且github上的广泛讨论 https://github.com/keras-team/keras/issues/6977），但他们描述的原因与我的情况无关：

使用binary_crossentropy进行多类任务（不是我的情况）
由于使用批量与整体而导致评估和预测之间的差异数据集（不应像我的情况那样导致如此剧烈的下降）
使用批量归一化和正则化（不是我的情况，也应该不会造成这么大的下降）

非常感谢任何建议。谢谢！

编辑！解决方案我已经找到了解决方案here https://github.com/keras-team/keras/issues/3296，我只需要打电话

train_generator.reset()

在 model.predict 之前，并在 flow_from_directory() 函数中设置 shuffle = False 。差异的原因是生成器输出从不同位置开始的批次，因此标签和预测将不匹配，因为它们与不同的对象相关。所以问题不在于评估或预测方法，而在于生成器。

EDIT 2如果使用 flow_from_directory() 创建生成器，则使用 train_generator.reset() 并不方便，因为它需要在 flow_from_directory 中设置 shuffle = False，但这会在训练期间创建包含单个类的批次，从而影响学习。所以我最终在运行预测之前重新定义了 train_generator 。

tensorflow.kerasAUC 通过黎曼和计算近似 AUC（曲线下面积），这与 scikit-learn 的实现不同。

如果你想找到 AUCtensorflow.keras, try:

import tensorflow as tf

m = tf.keras.metrics.AUC()

m.update_state(train_generator.labels, x) # assuming both have shape (N,)

r = m.result().numpy()

print(r)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

张量流 model.evaluate 和 model.predict 非常不同的结果的相关文章

NotImplementedError：尚未为未构建的模型子类启用“fit_generator”

我正在使用以下代码 import tensorflow as tf traindata tf keras preprocessing image ImageDataGenerator rescale 1 255 shear range 0
如何确定 Keras Conv2D 函数中的“filter”参数

我刚刚开始我的 ML 之旅并且已经完成了一些教程对我而言不清楚的一件事是如何为 Keras Conv2D 确定过滤器参数我读过的大多数资料只是将参数设置为 32 没有任何解释这只是经验法则还是输入图像的尺寸起作用例如 CIF
安装tensorflow的正确命令

当尝试在 Anaconda 上安装 Tensorflow 时我尝试了两种类型的命令 conda install tensorflow gpu工作得很好然而当尝试conda install c anaconda tensorflow g
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
将 Pytorch LSTM 的状态参数转换为 Keras LSTM

我试图将现有的经过训练的 PyTorch 模型移植到 Keras 中在移植过程中我陷入了LSTM层 LSTM 网络的 Keras 实现似乎具有三种状态类型的状态矩阵而 Pytorch 实现则具有四种状态矩阵例如对于hidden l
在 Keras 上使用回调 Tensorboard 时出现 AttributeError：“Model”对象没有属性“run_eagerly”

我已经使用 Keras 的功能 API 构建了一个模型当我将 Tensorboard 实例添加到 model fit 函数的回调中时它会抛出一个错误 AttributeError Model object has no attribut
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
将 Dropout 与 Keras 和 LSTM/GRU 单元结合使用

在 Keras 中您可以像这样指定 dropout 层 model add Dropout 0 5 但对于 GRU 单元您可以将 dropout 指定为构造函数中的参数 model add GRU units 512 return se
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
如何在 keras 中添加可训练的 hadamard 产品层？

我试图在训练样本中引入稀疏性我的数据矩阵的大小为比如说 NxP 我想将其传递到一个层 keras 层该层的权重大小与输入大小相同即可训练权重矩阵W的形状为NxP 我想对这一层的输入矩阵进行哈达玛乘积逐元素乘法 W 按元素与输入相乘
为什么LeNet5使用32×32图像作为输入？

我知道mnist数据集中的手写数字图像是28 28 但是为什么LeNet5中的输入是32 32 您的问题已在原纸 http yann lecun com exdb publis pdf lecun 98 pdf 卷积步骤始终采用比前一层的特
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
TensorFlow：在训练时更改变量

如果我将输入管道从 feed dict 更改为 tf data dataset 如何在每次迭代后的训练期间更改网络内参数的值澄清一下旧代码看起来像这样 Define Training Step model is some class t
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
张量流中的复杂卷积

我正在尝试运行一个简单的卷积但包含复数 r np random random 1 10 10 10 i np random random 1 10 10 10 x tf complex r i conv layer tf layers c
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back
在 Keras 中连接两个目录迭代器

假设我有类似以下内容 image data generator ImageDataGenerator rescale 1 255 train generator image data generator flow from director

随机推荐

Three.js 将一个对象添加到组中，但保持全局位置/旋转/缩放不变

我想将一个对象从一个组或世界场景移动到另一个组但保持其全局转换不变基本上我不想看到对象发生变化基本上是这样的 store current world transformation var origWorldMatrix myO
SQL 查询选择表中除两列之外的所有列

我在 ms access 中有一个表列名称为 A 到 H TableA A B C D E F G H 我如何编写一个查询来选择除 B 和 F 列之外的所有列查询结果应该是 A C D E G H 我们有这样的东西吗 select fr
连续从流中读取？

我有一个 Stream 对象偶尔会获取一些数据但间隔时间不可预测 Stream 上出现的消息是明确定义的并提前声明其有效负载的大小大小是包含在每个消息的前两个字节中的 16 位整数我想要一个 StreamWatcher 类来检测
Flask：如何读取应用程序根目录中的文件？

我的 Flask 应用程序结构如下 application top application static english words txt templates main html urls py views py runserver py
仅增加选定边缘的宽度 (cytoscape.js)

当我选择几个相连的节点或简单的边时如何预定义使所选边的宽度变大而不影响整个网络的其余边或节点的宽度我在选择节点或边时预定义了这一点 cy cytoscape style cytoscape stylesheet selector se
正则表达式匹配第一个和最后一个单词或任何单词

我有一个巨大的文件其中包含如下数据列表 fabulous 7 526 2301 2 excellent 7 247 2612 3 superb 7 199 1660 2 perfection 7 099 3004 4 terrific 6
将 Tweepy Status 对象转换为 JSON

我在用着Tweepy http www tweepy org下载推文我有一个程序然后编写实际的Status对象以文本形式存在于文件中如何将其转换为 JSON 或将此对象导入回 Python 我尝试过使用 JSON 库进行编码但 St
使用 XCB 获取键盘布局和按键符号

我正在为 Linux 创建一个集成在简单窗口管理器中的屏幕键盘我目前正在使用 XCB 现在我想制作假击键使用 xtest 扩展一切工作正常除了我无法从我想要放置的键符中获取真实键码的细节之外目前我正在使用 xcb key symbo
Django中如何防止多次登录

我正在编写一个无法同时登录的用户系统如果账户在某处处于登录状态而有人在其他位置登录同一个账户后一个将登录前一个将注销我正在使用一个模型其中 oneToOneField 与用户模型关联并保存该用户的会话 ID 代码如下 from
Angular 4：表单提交事件完成后关闭模式

我正在使用 bootstrap 4 modal 当我按下关闭按钮时 modal 会正确关闭但我想在提交表单中的创建按钮后关闭模式我正在使用角度4 div class modal fade div class modal dialog d
如何在 AfterMethod 中 TestNG 中测试失败？

我想在每次测试后检查一些外部日志文件看看执行过程中是否存在错误抛出异常AfterMethod不起作用因为 TestNG 的处理方式不同它只会使配置方法失败而不是前面的测试失败我的方法是这样的 AfterMethod always
Perl 脚本无法运行；仅在浏览器中显示实际代码

我是 Perl 新手无法让我的脚本正常运行我应该将实际的 Perl 脚本放在哪里才能正确运行我正在笔记本电脑上测试所有内容并尝试从 html 页面调用脚本而我得到的只是 Web 浏览器中显示的实际脚本代码本身而不是代码设计产
SQL Server 中的递归好吗？

我在 SQL Server 中有一个表它具有 Item ID Item ParentID 的正常树结构假设我想迭代并获取特定 Item ID 的所有子项在任何级别递归似乎是这个问题的直观候选者我可以编写一个 SQL Server
如何在一个 SSRS 页面上拥有多个表来表示 SQL 中的一个值？

我开发了一份一页报告其中有 4 个表格我对这个结果很满意这是针对一个地区显示的 district 002 数据集仅选择了一个地区我想在数据集中选择多个地区一个 SQL 字段并有多个页面代表每页一个地区所以换一种方式来说大约
authClient.login 返回错误“未经授权的请求来源”

这在过去几天里才开始发生我的代码没有改变我犯了一个错误还是这是新的这似乎意味着我应该在 firebase forge 中的安全规则中添加一条规则以允许从我正在处理的域在本例中为 localhost 进行访问但我不知道在哪里可以
使用汇编器（NASM 32 位）输入和处理 IEEE 784 上的浮点数

我正在大学学习计算机体系结构科目我被分配编写一个工具该工具将浮点数作为输入我想将其存储在内存中并打印出 IEEE 784 标准中数字的二进制表示形式的十六进制形式现在我确定了 IEEE 784 纸上将任何十进制浮点数转换为其二进制形
获取点阵条形图函数中分组条形的中点值

我试图弄清楚如何确定分组条形的中点值即每个条形中心的实际 X 位置这在基本 R 中很容易完成barplot功能但是我希望能够做到这一点lattice s barchart 我的目标是在相应栏的顶部显示文本列的值只要我不使用子组下面
在 Django 中启用 CORS（跨域请求）

我正在尝试使用立交桥 APIhttp wiki openstreetmap org wiki Overpass API http wiki openstreetmap org wiki Overpass API在 Django 上运行的项目
为什么R中order(order(x))等于rank(x)？

In this post http www portfolioprobe com 2012 07 26 r inferno ism order is not rank 据称order order x 是相同的rank X 虽然一些实验证实了
张量流 model.evaluate 和 model.predict 非常不同的结果

我正在构建一个简单的 CNN 用于二值图像分类并且从 model evaluate 获得的 AUC 远高于从 model predict roc auc score 获得的 AUC 整个笔记本是here https github com

张量流 model.evaluate 和 model.predict 非常不同的结果

张量流 model.evaluate 和 model.predict 非常不同的结果 的相关文章

随机推荐

热门标签

张量流 model.evaluate 和 model.predict 非常不同的结果的相关文章