scikit加权f1分数计算及使用

2024-04-24

我有一个关于weightedsklearn.metrics.f1_score 中的平均值

sklearn.metrics.f1_score(y_true, y_pred, labels=None, pos_label=1, average='weighted', sample_weight=None)

Calculate metrics for each label, and find their average, weighted by support (the number of true instances for each label). This alters ‘macro’ to account for label imbalance; it can result in an F-score that is not between precision and recall.

首先，如果有任何参考证明使用加权 F1 是合理的，我只是好奇在哪些情况下应该使用加权 F1。

其次，我听说加权 F1 已被弃用，是真的吗？

第三，例如，实际加权 F1 是如何计算的

{
    "0": {
        "TP": 2,
        "FP": 1,
        "FN": 0,
        "F1": 0.8
    },
    "1": {
        "TP": 0,
        "FP": 2,
        "FN": 2,
        "F1": -1
    },
    "2": {
        "TP": 1,
        "FP": 1,
        "FN": 2,
        "F1": 0.4
    }
}

如何计算上例的加权F1。我认为它应该类似于 (0.8*2/3 + 0.4*1/3)/3，但我错了。

首先，如果有任何参考证明使用加权 F1 是合理的，我只是好奇在哪些情况下应该使用加权 F1。

我没有任何参考资料，但如果您对多标签分类感兴趣，并且关心精度/召回率all类，那么加权 f1 分数是合适的。如果您有只关心正样本的二元分类，那么它可能不合适。

其次，我听说加权 F1 已被弃用，是真的吗？

不，加权 F1 本身并未被弃用。在 v0.16 中，仅弃用了函数接口的某些方面，然后只是为了在以前不明确的情况下使其更加明确。（历史讨论在 github 上 https://github.com/scikit-learn/scikit-learn/pull/2679或查看源代码 https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/metrics/classification.py并在页面中搜索“已弃用”以查找详细信息。）

第三，实际加权 F1 是如何计算的？

从文档f1_score:

``'weighted'``:
  Calculate metrics for each label, and find their average, weighted
  by support (the number of true instances for each label). This
  alters 'macro' to account for label imbalance; it can result in an
  F-score that is not between precision and recall.

所以平均值的加权是support，这是具有给定标签的样本数。由于您上面的示例数据不包含支持度，因此无法根据您列出的信息计算加权 f1 分数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

machinelearning

NLP

scikitlearn

precisionrecall

scikit加权f1分数计算及使用的相关文章

没有循环匹配指定的签名和转换错误

我是 python 和机器学习的初学者当我尝试将数据放入 statsmodels formula api OLS fit 时出现以下错误回溯最近一次调用最后一次文件第 47 行位于 regressor OLS sm OLS y
如果我使用不同数量的核心，XGBoost 会产生相同的结果吗？

我在两台机器上安装了完全相同版本的 XGBoost 0 4 两台机器之间的唯一区别是 RAM 和内核数量 8 与 16 使用完全相同的数据我无法重现相同的结果它们略有不同小数点后第四第五位种子保留为默认值它是高度特定于实现的但
如何提取数字（以及比较形容词或范围）

我正在用 Python 开发两个 NLP 项目它们都有类似的任务提取数值和比较运算符来自句子如下所示 greater than 10 weight not more than 200lbs height in 5 7 feets fas
Q-learning 和价值迭代有什么区别？

Q learning 与强化学习中的值迭代有何不同我知道 Q learning 是无模型的训练样本是过渡 s a s r 但是既然我们知道 Q 学习中的转换和每个转换的奖励那么它与基于模型的学习不一样吗在基于模型的学习中我们知道
将 OneClassSVM 与 GridSearchCV 结合使用

我正在尝试在 OneClassSVM 上执行 GridSearchCV 函数但我似乎无法找到 OCSVM 的正确评分方法根据我收集的信息像 OneClassSVM score 这样的东西不存在因此 GridSearchCV 中没有所
torch.stack() 和 torch.cat() 函数有什么区别？

OpenAI 的强化学习 REINFORCE 和 actor critic 示例具有以下代码加强 https github com pytorch examples blob master reinforcement learning r
scikit-learn：SVC 和 SGD 有什么区别？

SVM http scikit learn org stable modules svm html classification http scikit learn org stable modules svm html classific
ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

我有一个这样设置的目录 images val class1 class2 test all classes train class1 class2 每个目录中都有一组图像我想预测测试中的每个图像是否属于 1 类或 2 类我写这个是为了读
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
python中的语音识别持续时间设置问题

我有一个 Wav 格式的音频文件我想转录我的代码是 import speech recognition as sr harvard sr AudioFile speech file wav with harvard as source
SpaCy 模型“en_core_web_sm”的词汇量大小

我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词我也在同
如何对德语文本进行词形还原？

我有一篇德语文本我想对其应用词形还原如果不可能进行词形还原那么我也可以接受词干提取 Data 这是我的德语文本 mails Hallo Ich spielte am fr hen Morgen und ging dann zu ein
如何制作 U 矩阵？

为了可视化一个 U 矩阵到底是如何构建的自组织映射 http en wikipedia org wiki Self organizing map 更具体地说假设我有一个 3x3 节点的输出网格已经经过训练我如何从中构造一个 U 矩阵
ValueError: n_splits=10 不能大于每个类中的成员数

我正在尝试运行以下代码 from sklearn model selection import StratifiedKFold X hey join now hello join today join us now not today jo
在 TensorFlow 中将多个字节读取到单个值中

我尝试以 TensorFlow 中 cifar10 示例中描述的类似方式读取标签 label bytes 2 it was 1 in the original version result key value reader read fil
使用 scikit 确定每个特征对特定类别预测的贡献

我正在使用 scikit 额外的树分类器 model ExtraTreesClassifier n estimators 10000 n jobs 1 random state 0 一旦模型拟合并用于预测类别我想找出每个特征对特定类别预测
使用正则表达式标记化进行 NLP 词干提取和词形还原

定义一个函数名为performStemAndLemma 它需要一个参数第一个参数 textcontent 是一个字符串编辑器中给出了函数定义代码存根执行以下指定任务 1 对给出的所有单词进行分词textcontent 该单词应包含字
openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
R 中多类分类的 ROC 曲线

我有一个包含 6 个类别的数据集我想绘制多类别分类的 ROC 曲线 Achim Zeileis 给出的第一个答案非常好 R中使用rpart包的ROC曲线 https stackoverflow com questions 30818188
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable

随机推荐

无法通过 Socket.IO 从 cookie 获取 Express 会话 ID

我在 Node 中有一个典型的 Web 应用程序它利用 Express 框架和会话中间件我还将 Socket io 用于应用程序的某些动态部分目前这是一种聊天机制但这是无关的我已经能够成功地自行设置会话和socket io 但希
将 Flex ByteArray 转换为 Java byte[]

我正在尝试将使用 rtmp 协议从 Flex GUI 发送的文件上传到服务器上我昨天问如何在服务器上发送文件数据通过rtmps java上传文件到服务器 https stackoverflow com questions 2310855
Swift 中的拖放 - 注册拖动类型时出现问题？

背景我正在尝试在 Swift 中进行一些简单的拖放操作类似于 Apple 的示例代码可可拖放 https developer apple com library mac samplecode CocoaDragAndDrop Intro
Drupal 8自定义块（模块）创建twig模板文件

我有一个自定义模块它创建一个具有字段元素的自定义块这一切都很好但我需要为这个块设置主题我检查了这里的其他帖子并尝试过但没有成功我已经启用了 twig 调试并获得了主题建议还是没有运气谁能指出我正确的方向这是我到目前为止所拥有
使用 apply 函数重写循环

我有以下 3 个函数我想使其更快我认为应用函数是最好的方法但我从未使用过应用函数所以我不知道该怎么做任何类型的提示想法和代码片段将不胜感激 n T dt 是全局参数 par 是参数向量函数 1 是创建 m 1 n 矩阵的函数
如何将 Heroku PG 转储导入本地计算机

我正在尝试将生产 Heroku 数据库导入到我的开发机器中我的本地数据库是 PostgreSQL 首先我将转储从 Heroku 导出到我的机器 curl o latest dump heroku pgbackups url 然后我尝试
Java 中的事件顺序

我有两个独立组件的两个事件但有一个问题 JTabbedPane 的 stateChanged 事件在 JFormattedField 的 focusLost 事件之前触发有没有办法使 stateChange 事件在 focusLost
Qt 中浮点数的强制点而不是逗号

我有一个非常基本的问题如何在 Qt 中强制使用浮点数中的点而不是逗号我的操作系统有法语版本其他问题是否可以显示带有千位分隔符空格的数字尝试这个 QLocale loc QLocale system current locale l
WP8：使用ApplicationBar截屏

如何使用 ApplicationBar 截屏我使用的例子来自这个分行 https stackoverflow com questions 5553429 wp7 take screenshot from application 但通过这种
方法与类型 - 第 2 部分中的另一种方法具有相同的擦除

我完全明白这个问题方法与类型中的另一个方法具有相同的擦除 https stackoverflow com questions 1998544 method has the same erasure as another method in
如何在 MySQL 中声明变量以进行普通查询？

如何为 MySQL 中的普通查询声明变量 e g declare myVar date set myVar something select from someTable where someColumn myVar 我尝试过语法似乎是错
如何在大型光栅图像上将 Leaflet FlyTo() 与 unproject() 和 GeoJSON 数据结合使用？

我正在使用 Leaflet 构建故事地图使用切片为图块的大图像而不是真实世界地图数据我正在使用这个插件 https commenthol github io leaflet rastercoords https commenthol
如何在 Visual Studio 2010 中设置 CUDA 编译器标志？

经过坚持不懈的得到error identifier atomicAdd is undefined 我找到了编译的解决方案 arch sm 20旗帜但是如何在 VS 2010 中传递这个编译器标志呢我已经尝试过如下Project gt P
SQL Server：使用数字文字进行计算

我用浮点计算做了一些测试以尽量减少精度损失我偶然发现了一个现象我想在这里展示并希望得到解释当我写作时 print 1 0 1 0 60 0 结果是 60 0024000960 当我编写相同的公式并进行显式转换时float print
管理 2 个以上具有依赖关系的 Nodejs 包的开发

我正在开发 2 个 node js 包每个包都在自己的 git 存储库中管理包裹B取决于套餐A 所以我的本地目录结构如下所示 A1 B node modules A2 如果我更改本地代码A1 我想测试一下B在将其推送到公共存储库之前我
AddressBook：区分 kABSourceTypeExchangeGAL 类型的源

我要问的问题已经在这个网站上被问过很多次了到以前的线程的链接在我的问题下面使用 iOS AddressBook 并尝试获取 Exchange GAL 地址簿时类型名称返回 Nil 我使用的代码并在之前的所有线程中建议是 CFStr
OpenGL Z 偏置（多边形偏移）限制

我有两个共面的多边形我尝试做 glEnable GL POLYGON OFFSET FILL glPolygonOffset 0 1 并期望其中一个明显位于另一个之上这种情况直到大约 70 75 个单位之外近剪裁平面为 1 远剪裁
后台无限 While True 循环 (Python)

基本上我有一些这样的代码 while True number int len oilrigs 49 number money time sleep 1 在此之前我有一个启动屏幕然而由于这个 while true 循环它会阻止它运行实
某些方法上的 WCF REST 基本身份验证

我在 WCF 4 0 中实现了很多 RESTful GET 和 POST 方法所有这些都通过 SSL 进行一些方法的示例 OperationContract WebInvoke UriTemplate Login Method POST
scikit加权f1分数计算及使用

我有一个关于weightedsklearn metrics f1 score 中的平均值 sklearn metrics f1 score y true y pred labels None pos label 1 average weig

scikit加权f1分数计算及使用

scikit加权f1分数计算及使用 的相关文章

随机推荐

热门标签

scikit加权f1分数计算及使用的相关文章