Keras 如何处理多标签分类？

2023-12-08

我不确定如何解释 Keras 在以下情况下的默认行为：

我的 Y（基本事实）是使用 scikit-learn 设置的MultilabelBinarizer().

因此，举一个随机的例子，我的一排y列是 one-hot 编码的，如下所示：[0,0,0,1,0,1,0,0,0,0,1].

所以我有 11 类可以预测，并且不止一类可以是真实的；因此问题的多标签性质。该特定样本有三个标签。

我像处理非多标签问题（一切照常）一样训练模型，并且没有收到任何错误。

from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation
from keras.optimizers import SGD

model = Sequential()
model.add(Dense(5000, activation='relu', input_dim=X_train.shape[1]))
model.add(Dropout(0.1))
model.add(Dense(600, activation='relu'))
model.add(Dropout(0.1))
model.add(Dense(y_train.shape[1], activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy',
              optimizer=sgd,
              metrics=['accuracy',])

model.fit(X_train, y_train,epochs=5,batch_size=2000)

score = model.evaluate(X_test, y_test, batch_size=2000)
score

当 Keras 遇到我的时会做什么y_train并看到它是“多”单热编码的，这意味着每一行中存在多个“一”y_train？基本上，Keras 会自动执行多标签分类吗？对评分指标的解释有什么不同吗？

In short

不要使用softmax.

Use sigmoid用于激活输出层。

Use binary_crossentropy为损失函数。

Use predict进行评估。

Why

In softmax当一个标签的分数增加时，所有其他标签的分数都会降低（这是一种概率分布）。当你有多个标签时你不希望这样。

完整代码

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation
from tensorflow.keras.optimizers import SGD

model = Sequential()
model.add(Dense(5000, activation='relu', input_dim=X_train.shape[1]))
model.add(Dropout(0.1))
model.add(Dense(600, activation='relu'))
model.add(Dropout(0.1))
model.add(Dense(y_train.shape[1], activation='sigmoid'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='binary_crossentropy',
              optimizer=sgd)

model.fit(X_train, y_train, epochs=5, batch_size=2000)

preds = model.predict(X_test)
preds[preds>=0.5] = 1
preds[preds<0.5] = 0
# score = compare preds and y_test

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

neuralnetwork

Keras

multilabelclassification

Keras 如何处理多标签分类？的相关文章

在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
如何在VIM中设置文件的正确路径？

每当我击中 pwd在 vim 中命令总是返回路径C Windows system32 即使我在桌面上的 Python 文件中所以每当我跑步时 python 命令返回 python can t open file Users myname
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
揭秘sharedctypes性能

在 python 中可以在多个进程之间共享 ctypes 对象然而我注意到分配这些对象似乎非常昂贵考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何在 Django 中使用基于类的视图创建注册视图？

当我开始使用 Django 时我几乎使用 FBV 基于函数的视图来处理所有事情包括注册新用户但当我更深入地研究项目时我意识到基于类的视图通常更适合大型项目因为它们更干净且可维护但这并不是说 FBV 不是无论如何我将整个项目
Python Django-如何从输入文件标签读取文件？

我不想将文件保存在我的服务器上我只想在下一页中读取并打印该文件现在我有这个 index html
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
Django - 提交具有同一字段多个输入的表单

预警我对 Django 以及一般的 Web 开发非常陌生我使用 Django 托管一个基于 Web 的 UI 该 UI 将从简短的调查中获取用户输入通过我用 Python 开发的一些分析来提供输入然后在 UI 中呈现这些分析的可视
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
异常：加载数据时 URL 获取失败

我正在尝试设置我的机器来运行 Tensorflow 2 我从未使用过 Tensorflow 只是下载了 Python 3 7 我不确定这是否是我的机器的问题我按照上面列出的安装说明进行操作TensorFlow 的网站 https www
python 日志记录会刷新每个日志吗？

当我使用标准模块将日志写入文件时logging 每个日志会分别刷新到磁盘吗例如下面的代码会将日志刷新 10 次吗 logging basicConfig level logging DEBUG filename debug log fo
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

IntelliJ 问题 -> 无法创建名为“Main”的类

标题说明了我的问题我收到此错误消息无法创建类无法解析模板 Class 错误信息选定的类文件名 Main java 映射到非 java 文件类型通过 TextMate 捆绑包支持的文件有人对我如何解决这个问题有任何想法吗请检查文件
拆分字符串列值

acctcode primekey groupby lt columns WDS 1 NULL lt values varchar FDS 2 NULL IRN 3 NULL SUM 4 1 2 3 STL 5 NULL WTR 6 NUL
扩展 Asp.NET MVC3 控制器类

我是一位经验丰富的 NET 程序员也是一位使用 PHP 的 MVC 程序员现在我是 MVC3 的新手并尝试在其上构建我的第一个作品因此我正在处理一些问题对于初学者来说如何扩展控制器类有人可以指出我应该实施的指南方法列表吗 T
无法释放 C 中的 const 指针

我怎样才能释放一个const char 我使用分配新内存malloc 当我尝试释放它时我总是收到错误不兼容的指针类型导致此问题的代码类似于 char name Arnold const char str const char mall
Android 获取当前时间戳？

我想像这样获取当前时间戳 1320917972 int time int System currentTimeMillis Timestamp tsTemp new Timestamp time String ts tsTemp toStr
Jenkins：根据相同 Jenkins 作业中的每个构建步骤结果发送电子邮件

我只是想知道如何发送电子邮件电子邮件分机插件基于相同 Jenkins 作业的每个构建步骤结果这是我的场景我的 Jenkins 工作有 3 个构建步骤构建步骤1 Pull latest code from github and Buil
如何从 C++ 调用 fortran 例程？

我希望从我的 C 代码中调用 fortran 例程 cbesj f 如何实现此目的以下是我已完成的步骤从 netlib amos 网页下载 cbesj f 以及依赖项 http www netlib org cgi bin netlib
自动完成建议列表的 z-index 错误，我该如何更改？

似乎我的自动完成列表的 z index 比我网站的某些元素低所以它暴露不足我应该编辑什么类使用editCSS我播种这些类并添加我网站的z索引但很少有不影响的是1 ui corner all ui menu item ingred
如何打印第三列到最后一列？

我正在尝试从 DbgView 日志文件中删除前两列我对其中不感兴趣我似乎找不到从第 3 列开始打印直到行尾的示例请注意每行都有可变数量的列或更简单的解决方案 cut f 3 INPUTFILE只需添加正确的分隔符 d 即可获得相同
JTable 中的列的多个单元格渲染器？

假设我有以下 JTable 按下按钮后就会显示 Name True Hello World False Foo Bar True Foo False Bar 我想渲染那些单元格最初对于 JCheckBox 来说是正确的并且所有单元格都是最
MonoTouch.Dialog 崩溃

我有一个小型测试应用程序它仅在 3 个页面之间循环这是应用程序委托 public override bool FinishedLaunching UIApplication app NSDictionary options sessio
如何从嵌套函数内部访问 Stimulus JS 控制器方法？

我有一个 Stimulus 控制器其中有一个 setSegments 函数然后在 connect 方法中使用以下代码 connect const options overview container document getElemen
十六进制到二进制转换

我已通过十六进制转换器将 jpeg 文件转换为十六进制代码现在如何将该十六进制转换为二进制并另存为Jpeg磁盘上的文件 Like var 声明为十六进制代码然后将该 var 十六进制代码转换为二进制并保存在磁盘上 Edit Var my
如何使用X509使用JDBC连接MySQL？

我已经设置了 MySQL 社区服务器 5 1 数据库服务器我已经设置了 SSL 创建了证书等我创建了一个具有 REQUIRES X509 属性的用户我可以使用命令行客户端 mysql 使用此用户进行连接并且 status 命令显示
请解释一下此电子邮件验证正则表达式：[关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我有这个脚本使用正则表达式来检查表单字段是否包含有效的电子邮件地址请从声明中解释一下
Firebase 安全规则 - Auth 生成的 UID 是否应该保密？ [复制]

这个问题在这里已经有答案了我一直在阅读 Firebase 实时数据库安全规则指南 https firebase google com docs database security 我有点困惑是否应该将 Firebase Auth 生成的
如何将 Tensorflow BatchNormalization 与 GradientTape 结合使用？

假设我们有一个使用 BatchNormalization 的简单 Keras 模型 model tf keras Sequential tf keras layers InputLayer input shape 1 tf keras la
基于 gnu readline 的节点 shell

是否有一个在内部使用 gnu readline 的 Node 外壳 As you know node shell sucks in 2 ways among others It doesn t have search for history
是否可以将鼠标光标放在元素后面或者鼠标光标是否有 z 索引？

当鼠标悬停在某个元素上时我想用自定义图像替换鼠标光标我通过首先关闭鼠标光标来做到这一点 cursor none 当它悬停在元素上时然后我读出悬停元素上的光标位置并将图形的 css 位置设置为光标位置并稍微偏移以便鼠标光标不在图形上
Keras 如何处理多标签分类？

我不确定如何解释 Keras 在以下情况下的默认行为我的 Y 基本事实是使用 scikit learn 设置的MultilabelBinarizer 因此举一个随机的例子我的一排y列是 one hot 编码的如下所示 0 0 0

热门标签