FastText 0.9.2 - 为什么召回是“nan”？

2024-01-29

我使用 Python 接口在 FastText 中训练了一个监督模型，并且在精确度和召回率方面得到了奇怪的结果。

首先，我训练了一个模型：

model = fasttext.train_supervised("train.txt", wordNgrams=3, epoch=100, pretrainedVectors=pretrained_model)

然后我得到测试数据的结果：

def print_results(N, p, r):
    print("N\t" + str(N))
    print("P@{}\t{:.3f}".format(1, p))
    print("R@{}\t{:.3f}".format(1, r))

print_results(*model.test('test.txt'))

但结果总是很奇怪，因为它们显示的精度和召回率@1是相同的，即使对于不同的数据集，例如一个输出是：

N   46425
P@1 0.917
R@1 0.917

然后，当我寻找每个标签的精确度和召回率时，我总是得到“nan”的召回率：

print(model.test_label('test.txt'))

输出是：

{'__label__1': {'precision': 0.9202150724134941, 'recall': nan, 'f1score': 1.8404301448269882}, '__label__5': {'precision': 0.9134956983264135, 'recall': nan, 'f1score': 1.826991396652827}}

有谁知道为什么会发生这种情况？

P.S.：要尝试此行为的可重现示例，请参阅https://github.com/facebookresearch/fastText/issues/1072 https://github.com/facebookresearch/fastText/issues/1072并使用 FastText 0.9.2 运行它

看起来 FastText 0.9.2 在召回率计算中存在错误，应该使用以下命令修复该错误这次提交 https://github.com/facebookresearch/fastText/commit/b64e359d5485dda4b4b5074494155d18e25c8d13.

安装 FastText 的“前沿”版本，例如和

pip install git+https://github.com/facebookresearch/fastText.git@b64e359d5485dda4b4b5074494155d18e25c8d13 --quiet

并重新运行您的代码应该可以摆脱nan召回计算中的值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

NLP

textclassification

precisionrecall

fasttext

FastText 0.9.2 - 为什么召回是“nan”？的相关文章

如何使用 eval dataframe 方法在自定义函数中返回 numpy 数组或列表？

我正在使用 python 3 X 我正在尝试使用eval https pandas pydata org pandas docs stable generated pandas eval html pandas eval数据框方法包括这样
ModuleNotFoundError：没有名为“pandas.io.formats.csvs”的模块

我正在尝试创建一个简单的 csv dataframe to csv psv file name encoding utf 8 header True sep doublequote True quoting csv QUOTE ALL in
向 Python 函数添加属性的最佳方法

以计算数学函数的 Python 函数为例 def func x a b c Return the value of the quadratic function ax 2 bx c return a x 2 b x c 假设我想以函数属性的
Django celery 4 - ValueError：启动 celery 工作程序时，以 10 为基数的 int() 的文字无效

我已将 celery py 配置为其文档但我将 celery 代理 URL 放入 AWS SQS 但无法启动它工作当我运行 celery 工作程序时我得到的 ValueError 为 File Users abd Desktop pr
在嵌入中附加文件 (Discord.py)

我目前正在编写一个不和谐的机器人discord py Rewrite我想将图像附加到嵌入中但我无法弄清楚 import discord from discord ext import commands from discord impor
布尔 pandas 之间的操作对称性破缺。具有不等索引的系列

隐式索引匹配pandas用于不同之间的操作DataFrame Series很棒而且大多数时候它都有效但是我偶然发现了一个无法按预期工作的示例 import pandas as pd 0 21 0 import numpy as np
如何获取 sklearn.metrics.classification_report 的输出作为字典？

我一直在尝试以字典的形式获得分类报告所以根据 scikit learn 0 20 文档我这样做 from sklearn import metrics rep metrics classification report y true y
pyVISA：以编程方式将仪器返回到本地模式

我正在使用 pyVISA 来控制 GPIB 网络中的一些仪器当我创建资源管理器时 GPIB 网络中的所有仪器都会进入远程模式因此前面板显示被锁定并且不会更新当我关闭资源管理器时仪器仍处于远程模式 import visa rm vis
Python多处理错误“ForkAwareLocal”对象没有属性“连接”

下面是我的代码我面临着多处理问题我看到这个问题之前已经被问过我已经尝试过这些解决方案但它似乎不起作用有人可以帮我吗 from multiprocessing import Pool Manager Class X def init
mac安装Tensorflow出错

我正在尝试使用以下说明在 mac 中安装 Tensorflow https www tensorflow org install https www tensorflow org install 但是当我想导入tensorflow时我总是
在Spyder(Python 3.6)中导入cv2时出现导入错误

我已经在Windows操作系统中安装了opencv 3 0 0 我已运行该应用程序并已成功将其安装在C 驱动器并还复制了cv2 pyd文件输入C Python27 Lib site packages正如我在几个教程视频中看到的那样在我的
pip 安装最新的依赖版本

当我使用安装包时pip install e 它仅安装不满足的依赖项并忽略依赖项升级如何在每次运行时安装最新的依赖版本pip install e 我尝试过使用pip install upgrade e 但是使用这个选项没有任何改变我仍然得
使用 pyppeteer 与 asyncio 关联来抓取内容

我用 python 结合编写了一个脚本pyppeteer随着asyncio从其登陆页面抓取不同帖子的链接并最终通过跟踪通向其内页的 url 来获取每个帖子的标题我这里解析的内容不是动态的但是我利用了pyppeteer and asy
python win32com.client 调整窗口大小

我正在使用 Python 3 4 1 通过 win32com client 控制 Windows 应用程序我可以激活它我可以发送击键点击等现在我想知道是否有办法调整窗口大小并将其设置到特定位置我找不到方法这里有一些代码片段所以
nltk 标记化和缩写

我用 nltk 对文本进行标记只是将句子输入到 wordpunct tokenizer 中这会拆分缩写例如 don t 到 don t 但我想将它们保留为一个单词我正在改进我的方法以实现更精确的文本标记化因此我需要更深入地研究
Java 中的自然语言处理 (NLP) [重复]

这个问题在这里已经有答案了可能的重复 Java 有没有好的自然语言处理库 https stackoverflow com questions 870460 java is there a good natural language pro
在 pandas 中获取组名称的有效方法

我有一个包含大约 300 000 行的 csv 文件我将其设置为按特定列分组每个组大约有 140 名成员总共 2138 个组我正在尝试生成组名称的 numpy 数组到目前为止我已经使用 for 循环来生成名称但处理所有内容都需
相当于“setup.py”中的“--find-links”

相当于什么 find links f标记为pip in setup py I know dependency links存在但这需要指向一个特定的文件我想要类似的东西 f它可以指向一个链接列表可以根据版本和操作系统从中选择包 In a
Python3 venv：env目录可以重命名吗？

我在 Windows 上使用 Python 3 4 我创建了一个虚拟环境 python c Python34 Tools Scripts pyvenv py foo 然后激活它 foo 脚本 activate bat 并在其中安装了几个库
如何从 Python 3.5 降级到 3.4

我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目但是当尝试使用 pip 安装它所依赖的包时

随机推荐

Heroku 应用程序在 VPN 上调用外部 Web 服务 [已关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案所以我们有一个 Heroku 应用程序我们有一个在内联网上运行的 Web 服务该内网需要 VPN
Play Framework 2.3如何重置数据库？

在游戏中 2 3 x关于进化的文档 https www playframework com documentation 2 3 x Evolutions它说然而在开发模式下简单地丢弃开发数据库并从头开始重新应用所有演变通常更简单但它
如何在不使用Iterator的情况下从Hashmap中获取值？

Iterator iterator map entrySet iterator while iterator hasNext Map Entry mapEntry Map Entry iterator next System out pri
Web 服务超时的最佳实践[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是否有任何文章书籍定义了 WS 超时的设计上限您是否在服务器上超时或也建议客户端特定超时是否有一个常见的最佳实践例如永远不要
将 pandas 数据框和系列相乘，逐元素

假设我有一个熊猫系列 import pandas as pd x pd DataFrame 0 1 2 3 1 4 5 6 2 7 8 9 y pd Series 1 1 1 我想将 x 和 y 相乘得到 z z pd DataFrame
RxJava：如何制作一次获取并重用的 Observable？

在每次应用程序启动时我都有一个 Retrofit Observable 从服务器获取用户的用户名我想为每个后续订阅者使用这个值但似乎每次我调用 subscribe 时都会从网络重新获取该值由于用户名在应用程序的生命周期中不太可能更
有效检查 numpy ndarray 值是否严格递增

我有一个 numpy ndarray 我想检查每个行向量是否单调递增 Example a np asarray 1 2 3 1 5 7 4 3 6 monotonically increasing a 预期收益 True True Fals
当我尝试使用 PIP 安装库时，出现 AttributeError: module 'collections' has no attribute 'Iterable'

我刚刚在我的新电脑上安装了 python3 并尝试安装一些库 numpy cython cymem using pip我得到 AttributeError module collections has no attribute Iterab
迭代 json 对象并将每个对象（图像）附加到 HTML div 标签

我的要求是我有一个 json 对象其中包含一些 URL URL 是图像的 URL 及其名称我想迭代 JSON 对象并想要获取 URL 只是图像并想要附加将图像放入 div 中这样我就可以看到 JSON 对象中的图像假设这是我的代
了解 Java API 中 AppEngine 键名称的最大长度

我想弄清楚 AppEngine 的最大长度是多少key name https cloud google com appengine docs java javadoc com google appengine api datastore K
Powershell 和上次修改日期

我在windows环境下工作我有一个项目需要一个简短的脚本来确定文件夹中是否存在具有今天修改日期的文件如果文件存在则应复制它如果文件不存在则应返回错误代码我不想使用第三方应用程序我正在考虑使用powershell 我可以拉出一
如何制作Windows服务应用程序以便它也可以作为独立程序运行？

我将从一个例子开始 Apache Web 服务器在 Windows 下有一个很好的功能它既可以作为独立应用程序运行具有当前用户权限也可以直接作为 Windows 服务安装和运行作为本地系统帐户使用相同的可执行文件为了使应用程
iOS 7：“isa”已弃用

当我在 iOS7 中运行我的应用程序时我收到警告 isa 已弃用我不知道如何修复此警告消息请任何人对此提供帮助 array gt isa JKArrayClass Include
将 8BIM 配置文件元数据添加到 tiff 图像文件

我正在开发一个程序该程序需要 8BIM 配置文件信息存在于 tiff 文件中才能继续处理在 Adob e Photoshop 中打开并保存示例 tiff 文件不包含 8BIM 配置文件信息时会获取此元数据信息我不知道如何解决这个
Tomcat 7startup.bat异常

当我运行 Tomcat 7 的startup bat 文件时出现以下错误信息初始化 ProtocolHandler http apr 8080 三月 01 2014 12 18 22 PM org apache coyote Abst
诊断 .NET 应用程序中的“找不到文件”错误

我正在使用 NET 4 0 应用程序该应用程序失败并显示以下错误 System ComponentModel Win32Exception例外我已将其附加到 WinDBG 以尝试了解更多信息 0 000 gt sxe clr 0 000
AWS CloudWatch 日志订阅过滤器解码

我正在使用 CloudWatch 日志订阅过滤器流式传输到 Lambda 并将消息发布到 SNS 主题但会输出乱码无法成功解码我的输出 k jVbB 如果不解码将输出如下 awslogs data BASE64ENCODED GZIP
包含在多个类中时的 iOS 6 外观

我正在使用appearanceWhenContainedIn我想在 iOS 6 应用程序中自定义某些 UI 元素的方法我发现的问题是如果我尝试提供多个容器类则不会应用任何自定义设置如下所示 Works neither for too
使用 AtomicReference.compareAndSet 设置对数据库调用结果的引用是否合适？

我正在实现一个简单的缓存并将缓存存储为 AtomicReference private AtomicReference
FastText 0.9.2 - 为什么召回是“nan”？

我使用 Python 接口在 FastText 中训练了一个监督模型并且在精确度和召回率方面得到了奇怪的结果首先我训练了一个模型 model fasttext train supervised train txt wordNgrams

FastText 0.9.2 - 为什么召回是“nan”？

FastText 0.9.2 - 为什么召回是“nan”？ 的相关文章

随机推荐

热门标签

FastText 0.9.2 - 为什么召回是“nan”？的相关文章