Tensorflow、Keras：在多类分类中，准确率很高，但大多数类别的精度、召回率和 f1 分数为零

2023-12-29

一般说明：我的代码工作正常，但结果是有线的。我不知道问题出在

网络结构，
或者我向网络提供数据的方式，
或其他任何东西。

我为这个错误苦苦挣扎了几个星期，到目前为止我已经改变了损失函数、优化器、数据生成器等，但我无法解决它。我很感激任何帮助。如果以下信息还不够，请告诉我。

研究领域：我正在使用张量流、keras 进行多类分类。该数据集有 36 个二元人类属性。我使用了resnet50，然后对于身体的每个部分（头部，上半身，下半身，鞋子，配件），我都在网络中添加了一个单独的分支。该网络有 1 个输入图像，带有 36 个标签和 36 个输出节点（具有 sigmoid 激活的 36 个定义层）。

Problem:问题是 keras 报告的准确性很高，但大多数输出的 f1-score 非常低或为零（即使我在编译网络时使用 f1-score 作为指标，用于验证的 f1-socre 是很坏）。

a训练结束后，当我在预测模式下使用网络时，对于某些类，它始终返回一/零。这意味着网络无法学习（即使我使用加权损失函数或焦点损失函数。）

为什么奇怪呢？因为，即使在第一个 epoch 之后，最先进的方法也会报告较高的 f1 分数（例如https://github.com/chufengt/iccv19_attribute https://github.com/chufengt/iccv19_attribute，我已经在我的电脑上运行它并在一个时期后获得了良好的结果）。

部分代码：

        print("setup model ...")
        input_image = KL.Input(args.img_input_shape, name= "input_1")
        C1, C2, C3, C4, C5 = resnet_graph(input_image, architecture="resnet50", stage5=False, train_bn=True)
        output_layers = merged_model (input_features=C4)
        model = Model(inputs=input_image, outputs=output_layers, name='SoftBiometrics_Model')

...

        print("model compiling ...")
        OPTIM = optimizers.Adadelta(lr=args.learning_rate, rho=0.95)
        model.compile(optimizer=OPTIM, loss=binary_focal_loss(alpha=.25, gamma=2), metrics=['acc',get_f1])
        plot_model(model, to_file='model.png')

...

        img_datagen = ImageDataGenerator(rotation_range=6, width_shift_range=0.03, height_shift_range=0.03, brightness_range=[0.85,1.15], shear_range=0.06, zoom_range=0.09, horizontal_flip=True, preprocessing_function=preprocess_input_resnet, rescale=1/255.)
        img_datagen_test = ImageDataGenerator(preprocessing_function=preprocess_input_resnet, rescale=1/255.)

        def multiple_outputs(generator, dataframe, batch_size, x_col):
          Gen = generator.flow_from_dataframe(dataframe=dataframe,
                                               directory=None,
                                               x_col = x_col,
                                               y_col = args.Categories,
                                               target_size = (args.img_input_shape[0],args.img_input_shape[1]),
                                               class_mode = "multi_output",
                                               classes=None,
                                               batch_size = batch_size,
                                               shuffle = True)
          while True:
            gnext = Gen.next()
            # return image batch and 36 sets of lables
            labels = gnext[1]
            output_dict = {"{}_output".format(Category): np.array(labels[index]) for index, Category in enumerate(args.Categories)}
            yield {'input_1':gnext[0]}, output_dict

    trainGen = multiple_outputs (generator = img_datagen, dataframe=Train_df_img, batch_size=args.BATCH_SIZE, x_col="Train_Filenames")
    testGen = multiple_outputs (generator = img_datagen_test, dataframe=Test_df_img, batch_size=args.BATCH_SIZE, x_col="Test_Filenames")

    STEP_SIZE_TRAIN = len(Train_df_img["Train_Filenames"]) // args.BATCH_SIZE
    STEP_SIZE_VALID = len(Test_df_img["Test_Filenames"]) // args.BATCH_SIZE

    ...

    print("Fitting the model to the data ...")
            history = model.fit_generator(generator=trainGen,
                                         epochs=args.Number_of_epochs,
                                         steps_per_epoch=STEP_SIZE_TRAIN,
                                         validation_data=testGen,
                                         validation_steps=STEP_SIZE_VALID,
                                         callbacks= [chekpont],
                                         verbose=1)

您有可能将二进制 f1-score 传递给compile功能。这应该可以解决问题 -

pip install tensorflow-addons

...

import tensorflow_addons as tfa 

f1 = tfa.metrics.F1Score(36,'micro' or 'macro')

model.compile(...,metrics=[f1])

您可以阅读有关如何计算 f1-micro 和 f1-macro 以及哪些内容有用的更多信息here https://towardsdatascience.com/a-tale-of-two-macro-f1s-8811ddcf8f04.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow、Keras：在多类分类中，准确率很高，但大多数类别的精度、召回率和 f1 分数为零的相关文章

Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
分布式张量流 tf.train.SyncReplicasOptimizer 似乎不同步

我使用两个工作程序副本和一个参数服务器喜欢 ps hosts hosta com 2222 worker hosts hosta com 2223 hostb com 2223 使用tf train SyncReplicasOptimi
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
带有 s3 路径的张量板 logdir

我看到tensorflow支持AWS s3文件系统 https github com tensorflow tensorflow tree master tensorflow core platform s3 https github co
Keras 服装回调。生成精确召回时，我在 _flow_index 中收到错误

我正在使用 Keras 训练二元分类器我想在每个时期后生成 precision score 和 recall score 以便更深入地分析训练在互联网上我找到了教程帮助例如 https medium com thongonary h
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
TensorFlow：有没有办法将冻结图转换为检查点模型？

可以将检查点模型转换为冻结图 ckpt 文件转换为 pb 文件但是是否有反向方法将 pb 文件再次转换为检查点文件我想它需要将常量转换回变量有没有办法将正确的常量识别为变量并将它们恢复回检查点模型目前支持将变量转换为常量 http
如何在anaconda python 3.6上安装tensorflow

我使用 anaconda 包安装了新版本的 python 3 6 但是我无法安装张量流总是收到这样的错误 tensorflow gpu 1 0 0rc2 cp35 cp35m win amd64 whl 在此平台上不受支持如何在 ana
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
NotImplementedError：尚未为未构建的模型子类启用“fit_generator”

我正在使用以下代码 import tensorflow as tf traindata tf keras preprocessing image ImageDataGenerator rescale 1 255 shear range 0
在 Tensorflow 对象检测 API 中绘制验证损失

我正在使用 Tensorflow 对象检测 API 来检测和定位图像中的一类对象为了这些目的我使用预先训练的faster rcnn resnet50 coco 2018 01 28 model 我想在训练模型后检测拟合不足过度拟合我
ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video

随机推荐

android studio onMapReady 未调用

我想将地图视图集成到我的一个视图中我已经生成了一个新的地图片段它以不同的视角出现并且像魅力一样发挥作用然后我尝试将代码集成到正常活动中带有操作栏等它有点有效在屏幕上显示得很好但 onMapReady 在那种环境中永远不会被
django中的自定义用户模型不允许在admin中设置密码

我创建了一个自定义用户模型并在我的应用程序中成功使用了该模型问题是在管理中在用户编辑屏幕上我显示当前密码哈希而不是用于设置密码的非常有用的界面我在 Python 2 7 上使用 Django 1 5b1 为了管理用户界面如何
如何在 Java 8 中从有限流构建无限重复流？

我怎样才能转动有限的事物流Stream
更改 ionic 2 应用程序中的 iOS 状态栏颜色

我正在按照 ionic 2 文档设置 iOS 状态栏颜色但它不起作用状态栏文本是白色的这意味着在我的白色背景上它是不可见的我在应用程序构造函数中放入的代码是 StatusBar overlaysWebView true Status
从 Access DB 发送包含动态名称附件的电子邮件

我不知道如何让这个东西继续工作下面的代码发送一封电子邮件其中包含 MS Access 2010 的附件问题是如果它需要固定的文件名那么当我使用每个文件末尾的日期时我的文件名会发生变化示例 green 12 04 2012 cs
使用 AWK 中的第一个字段作为文件名

该数据集是一个包含三列的大文件一个部分的 ID 一些不相关的内容和一行文本示例可能如下所示 A01 001 This is a simple test A01 002 Just for exemplary purpose A01 003
将 NServiceBus 与 Asp.Net MVC 2 结合使用

有没有办法将 NServiceBus 与 Asp Net MVC 2 一起使用我想将请求消息从 Asp Net MVC2 应用程序发送到服务该服务处理该消息并回复响应消息有没有办法清楚地做到这一点 NServiceBus 仅支持注册状
Jquery 冲突导致错误

从事具有多种功能的项目例如谷歌翻译图像滑块使用画廊弹出窗口使用阴影框 JavaScript 水平菜单栏 Now we are getting jquery conflict in it and error message suc
从 Docker 容器获取 Mac 地址

是否可以从Docker容器中获取主机的MAC地址并将其写入文本文件中 docker inspect
GCS - Python 下载具有目录结构的 blob

我使用 GCS python SDK 和 google API 客户端的组合来循环启用版本的存储桶并根据元数据下载特定对象 from google cloud import storage from googleapiclient impo
计算负载并避免光标

给出下面的表结构它表示乘客通过门磁上下车的公交路线而且有一个人坐在那辆公共汽车上手里拿着一个记着点数的剪贴板 CREATE TABLE BusLoad ROUTE CHAR 4 NOT NULL StopNumber INT NOT
从 Powershell 调用 AppDomain.DoCallback

这是基于 Stack Overflow 问题如何在新的 AppDomain 中将程序集加载为仅反射 https stackoverflow com questions 35249342 how to load an assembly as
选择 Plsql 中的第二行

假设我有下表 SomeTable id price 如何从此表中选择价格第二高的行注意这必须在 Pl SQL 中以与数据库无关的方式完成是否可以在没有任何循环的情况下做到这一点我知道这是如何使用 Oracle 结构来完成的例如ro
“不要在设计中使用抽象基类；但在建模/分析中”

虽然我在 OOAD 方面有一些经验但我是 SOA 的新手 SOA 设计的指导原则之一是仅使用抽象类进行建模从设计中省略它们抽象的使用有助于建模分析阶段在分析阶段我提出了一个 BankAccount 基类从它派生的专门类是 F
将 Java 7 与官方 Google Appengine Maven 插件结合使用

我在使用时遇到问题官方 Maven 插件 https developers google com appengine docs java tools maven以及带有 Google Appengine 的 Java 7 配置我的项目配置
优先级队列数据结构

假设我有一个优先级队列它按升序删除元素并且存储在该队列中的是元素1 1 3 0 1 递增的顺序是0 then 1 then 3 但是有三个元素1s 当我打电话时remove它会首先删除0 但如果我打电话remove它会再次删除所有三个吗
提高功能性能

我正在编写一个小程序来检查以下问题的解决方案布罗卡的问题 http en wikipedia org wiki Brocard s problem或所谓的棕色数字我首先用 ruby 创建了一个草稿 class Integer def fac
在 Xcode 中创建和编辑 plist 文件的步骤

我想添加密钥对值plist 我不知道如何在 XCode 中添加 plist 文件只是我想将这些详细信息添加到名为的 plist 文件中 Mobile plist Apple iPhone iPod iPad Samsung Galaxy
Java 中可以使用 C# 风格的对象初始化吗？

在 C 中可以这样写 MyClass obj new MyClass field1 hello field2 world field3 new MyOtherClass etc 我可以看到数组初始化可以用类似的方式完成但是在 Java 中
Tensorflow、Keras：在多类分类中，准确率很高，但大多数类别的精度、召回率和 f1 分数为零

一般说明我的代码工作正常但结果是有线的我不知道问题出在网络结构或者我向网络提供数据的方式或其他任何东西我为这个错误苦苦挣扎了几个星期到目前为止我已经改变了损失函数优化器数据生成器等但我无法解决它我很感激任何帮助如果

Tensorflow、Keras：在多类分类中，准确率很高，但大多数类别的精度、召回率和 f1 分数为零

Tensorflow、Keras：在多类分类中，准确率很高，但大多数类别的精度、召回率和 f1 分数为零 的相关文章

随机推荐

热门标签

Tensorflow、Keras：在多类分类中，准确率很高，但大多数类别的精度、召回率和 f1 分数为零的相关文章