Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

2024-04-09

您好，我正在致力于使用新的 SpaCy 模型实现多分类模型（5 类）en_pytt_bertbaseuncased_lg。新管道的代码在这里：

nlp = spacy.load('en_pytt_bertbaseuncased_lg')
textcat = nlp.create_pipe(
    'pytt_textcat',
    config={
        "nr_class":5,
        "exclusive_classes": True,
    }
)
nlp.add_pipe(textcat, last = True)

textcat.add_label("class1")
textcat.add_label("class2")
textcat.add_label("class3")
textcat.add_label("class4")
textcat.add_label("class5")

训练代码如下，基于此处的示例（https://pypi.org/project/spacy-pytorch-transformers/ https://pypi.org/project/spacy-pytorch-transformers/):

def extract_cat(x):
    for key in x.keys():
        if x[key]:
            return key

# get names of other pipes to disable them during training
n_iter = 250 # number of epochs

train_data = list(zip(train_texts, [{"cats": cats} for cats in train_cats]))


dev_cats_single   = [extract_cat(x) for x in dev_cats]
train_cats_single = [extract_cat(x) for x in train_cats]
cats = list(set(train_cats_single))
recall = {}
for c in cats:
    if c is not None: 
        recall['dev_'+c] = []
        recall['train_'+c] = []



optimizer = nlp.resume_training()
batch_sizes = compounding(1.0, round(len(train_texts)/2), 1.001)

for i in range(n_iter):
    random.shuffle(train_data)
    losses = {}
    batches = minibatch(train_data, size=batch_sizes)
    for batch in batches:
        texts, annotations = zip(*batch)
        nlp.update(texts, annotations, sgd=optimizer, drop=0.2, losses=losses)
    print(i, losses)

所以我的数据结构如下所示：

[('TEXT TEXT TEXT',
  {'cats': {'class1': False,
    'class2': False,
    'class3': False,
    'class4': True,
    'class5': False}}), ... ]

我不确定为什么会出现以下错误：

TypeError                                 Traceback (most recent call last)
<ipython-input-32-1588a4eadc8d> in <module>
     21 
     22 
---> 23 optimizer = nlp.resume_training()
     24 batch_sizes = compounding(1.0, round(len(train_texts)/2), 1.001)
     25 

TypeError: Model() got multiple values for argument 'nr_class'

EDIT:

如果我取出 nr_class 参数，我会在这里收到此错误：

ValueError: operands could not be broadcast together with shapes (1,2) (1,5)

我实际上认为会发生这种情况，因为我没有指定 nr_class 参数。那是对的吗？

这是我们发布的最新版本中的回归spacy-pytorch-transformers。为此事道歉！

根本原因是，这又是一个罪恶的案例。**kwargs。我期待着完善 spaCy API 以防止将来出现这些问题。

您可以在此处查看有问题的行：https://github.com/explosion/spacy-pytorch-transformers/blob/c1def95e1df783c69bff9bc8b40b5461800e9231/spacy_pytorch_transformers/pipeline/textcat.py#L71 https://github.com/explosion/spacy-pytorch-transformers/blob/c1def95e1df783c69bff9bc8b40b5461800e9231/spacy_pytorch_transformers/pipeline/textcat.py#L71。我们提供nr_class位置参数，它与您在配置过程中传入的显式参数重叠。

为了解决该问题，您只需删除nr_class钥匙从你的config你正在传入的字典spacy.create_pipe().

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）的相关文章

AWS Lambda 错误：无法导入模块“function_name”：没有名为“module._module”的模块

阅读后请特别查看屏幕截图我正在 AWS Lambda 上部署一个使用该包的 python 脚本impyla它依赖于包bitarray from impala dbapi import connect 我的Python文件名为authori
from __future__ importabsolute_import 实际上做了什么？

I have answered https stackoverflow com a 22679558 2588818一个关于Python中绝对导入的问题我认为我通过阅读理解了这个问题Python 2 5 变更日志 https docs p
将 KB/MB/GB 等字符串解析为数值

为了不发明自行车我想知道是否有任何库能够将大小字符串 MB KB TB MiB KiB 等的各种表示形式解析为基于数字字节的值 ActiveState Receipes 有一个示例here http code activestate c
Python 3：如何更改GDAL中的图像数据？

我有一个 GeoTIFF 图像其中包含颜色表和带有 8 位表键的单个栅格带并且使用 LZW 压缩我加载该图像gdal Open https gdal org python osgeo gdal module html 我还有一个包含
如何将当前日期分配给 odoo v8 中的日期字段？

我想将当前日期分配给以下代码中的日期字段 start date calendar obj create cr uid name rec res act ion user id rec res asgnd to id start date l
Python - 如何将双引号附加到字符串并存储为新字符串？

我正在使用 Python 2 6 并且想将双引号附加到字符串并将其存储为新的字符串变量我不想打印它但稍后在我的 python 脚本中使用它例如 a apple b some function a gt b would be equal
使用 boto 和 python 从带有参数的布局创建 mTurk HIT

我正在尝试利用 boto 在 Mechanical Turk 中生成 HIT 目标是使用我的 mTurk 帐户上已生成的通用布局并向其传递图像 URL 以迭代创建 HIT 问题是即使正确命名参数如果图像 url boto 也不成功我
混淆矩阵错误“分类指标无法处理多标签指标和多类目标的混合”

我得到了 Classification metrics can t handle a mix of multilabel indicator and multiclass targets 当我尝试使用混淆矩阵时出错我正在做我的第一个深度学
在用户提交的正则表达式中查找捕获组

我有一个 python 应用程序需要处理用户提交的正则表达式出于性能考虑我想禁止捕获组和反向引用我的想法是使用另一个正则表达式来验证用户提交的正则表达式不包含任何命名或未命名的组捕获如下所示 def validate user r
没有名为 objc 的模块

我正在尝试将 cocoa python 与 Xcode 一起使用但它总是会出现错误 Traceback most recent call last File main py line 10 in
让垂直网格线出现在 matplotlib 的线图中

我想在绘图上同时获得水平和垂直网格线但默认情况下仅显示水平网格线我正在使用一个pandas DataFrame从 python 中的 sql 查询生成 x 轴上带有日期的线图我不知道为什么它们没有出现在日期上我试图寻找这个问题的答案
SyntaxError：多个异常类型必须用括号括起来

我是初学者在使用 python 安装 pycaw 进行音频控制后遇到问题在放置 pycaw 的基本初始化代码时出现以下错误 Traceback most recent call last File c Users volumeCont
python中不规则点之间的坐标列表

想象一下我们为 x 和 y 随机选择两个介于 0 到 100 之间的点例如 95 7 35 6 现在使用简单的 pygame draw line 函数我们可以轻松地在这些点之间绘制一条没有任何间隙的线我的问题是我们如何找到两点之间
传递宏作为参数 jinja dbt

Today date milliseconds 是我在项目中的宏如何将此宏重定向为参数以便默认情况下我可以在 yml 中编写另一个宏 test valid date model column name exclude condition
如何在Python中设置像素的alpha值

我正在尝试编辑image https drive google com file d 0B8JcwRV HVk0OURrcTFJczhmV2RlUGdMOG0ybldYUVRoamtF view usp sharing以一种将所有白色像素转
嵌套 for 循环以列出具有不同“if”条件的理解

我正在尝试将此嵌套循环转换为列表理解但我不确定是否可能因为 tmp 列表中的项目可能有不同的值这是最好的方法吗谢谢 final for a in range 13 1 for b in range 0 4 for c in rang
将数值和分类数据混合到具有密集层的 keras 序列模型中

我在 Pandas 数据框中有一个训练集我将此数据框传递到model fit with df values 以下是有关 df 的一些信息 df values shape 981 5 df values 0 array 163 0 6 83
Scrapy文件下载如何使用自定义文件名

For my scrapy http doc scrapy org index html我目前正在使用的项目文件管道 https doc scrapy org en latest topics media pipeline html scr
尝试输入字符串时出现名称错误[重复]

这个问题在这里已经有答案了 import pickle import os import time class Person def init self number address self number number self addr
如何在Python中检查元组是否包含元素？

我试图找到可用的方法但找不到没有contains 我应该使用index 我只想知道该项目是否存在不需要它的索引 You use in if element in thetuple whatever you want to do

随机推荐

SQL 查询查找车站之间的火车

这是我的火车时刻表我想要一个车站之间火车的解决方案 Train Code 15609 ABC 15609 XYZ 15609 PQR 15609 ADI 15609 QWE 15609 XPM 15609 IND 15680 ABC 15
如何在haml模板中的coffescript中的ruby代码中使用本地或实例变量

我是 Rails 的新手并面临着复杂的问题试图在 Haml 模板的 CoffeeScript 中的 ruby 辅助方法中使用变量这是我在 haml 中的代码 coffee input field blur gt input input
Maven 依赖插件：复制依赖项：排除单个工件

我需要从 maven dependency plugin copy dependencies 中排除单个工件在文档上 https maven apache org plugins maven dependency plugin copy
set 和 freezeset 的继承行为似乎不同

有人可以解释以下行为 class derivedset1 frozenset def new cls args return frozenset new cls args class derivedset2 set def new cls
在 vscode 中找不到 python 调试适配器 - WSL:Ubuntu

我正在尝试使用 vscode 调试 python 脚本远程WSL https marketplace visualstudio com items itemName ms vscode remote remote wsl使用 Python
如何显示本地h2数据库的内容（Web控制台）？

最近我加入了一个新团队这里的人使用 h2 进行存根服务我想知道是否可以使用网络界面显示该数据库的内容在工作中可以通过访问localhost 5080 我有一个使用 h2 数据库的项目但是当我点击时我看不到 h2 Web 控制台lo
如何将证书作为秘密存储在AWS秘密管理器中？如何使用 AWS appSync 解析器在 https 调用中传递该秘密？

我需要从 AWS dynamoDB 和第三方 httpd 服务获取元素并将这些结果合并到 AWS appSync 中并将结果作为 graphQL 响应发回我正在使用的第三方服务需要客户端证书我没有找到有关如何使用 AWS appSy
拍照之前必须启动预览模式

我们使用 cwac camera 在我们的应用程序中获取这样的堆栈跟踪 java lang IllegalStateException Preview mode must have started before you can take a
使用 Python 更改 XML 文件中包含的文本的最佳方法是什么？

假设我有一个名为 MyData xml 的现有简单 XML 文件其中包含以下内容
使用 xscreensaver 编写屏幕保护程序的提示和技巧？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 几个月来我一直在做一些简单的 Ope
SiteMesh：更改响应的内容类型

我试图说服 SiteMesh 装饰器更改响应的内容类型但没有任何乐趣内容类型最终总是与装饰后的 JSP 相同而不是装饰器的内容类型例如假设我有一个带有标头的 JSP 我还有一个 SiteMesh 装饰器 JSP 它定义了以下内容
groupby.first() 和 groupby.head(1) 有什么区别？

两者都返回每组第一行的 DataFrame 在阅读 API 参考时它首先说计算第一组值但是当并排查看两个输出时我没有发现重大差异我错过了什么吗 df pd DataFrame id 1 1 1 2 2 3 3 3 3 4 4 5
iPhone - 在 UITextfield 下面显示错误消息的最佳方式是什么[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我有一个包含许多 UITextfields 如名称密码电子邮件等的表单在验证过程中我想显示相应文本字段下方字段的错误消息做这个的最好
抓取和解析多页（aspx）表

我正在尝试搜集有关灰狗比赛的信息例如我想刮http www gbgb org uk RaceCard aspx dogName Hardwick 20Serena http www gbgb org uk RaceCard aspx d
如何在 R 中获取 AST 作为列表

我有字符串它描述数学公式我想将其转换为有意义部分的列表功能ast 确实知道如何解析它将其显示为抽象语法树但不返回 AST 我正在寻找一个返回树的函数 bb lt media urin A media urin B 2 lazyev
SLURM 每个节点提交多个任务？

我发现了一些非常相似的问题这些问题帮助我得到了一个似乎有效的脚本但我仍然不确定我是否完全理解为什么因此这个问题我的问题示例在 3 个节点上我想在每个节点上运行 12 个任务总共 36 个任务此外每个任务都使用 OpenM
javascript 按子列表第二个条目对列表列表进行排序

如何按最后一个元素的顺序对列表列表进行排序这是迄今为止我最好的尝试 var mylist 1 c 3 a 5 b mylist sort function a b return a 1 b 1 我打电话给sort没有效果并且mylist
CATextLayer 包裹了 sizeToFit？

如果我设置textLayer wrapped YES 如何调整大小textLayer包含换行文本即我如何获得新的高度textLayer 基本上我想要类似的东西 UILabel sizeToFit 您需要做的第一件事是获取文本的大小值
如何使用 Python/Glade 更改主窗口小部件？

我对 GUI 编程或多或少是个新手只是有一点点 Perl Tk 经验我是 Python 新手也是 Glade 新手我想学习如何使用它们我心中有一个程序需要一个窗口但该窗口的内容小部件和所有内容必须随着用户完成的每一步而改变
Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

您好我正在致力于使用新的 SpaCy 模型实现多分类模型 5 类 en pytt bertbaseuncased lg 新管道的代码在这里 nlp spacy load en pytt bertbaseuncased lg textcat

Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）

Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成） 的相关文章

随机推荐

热门标签

Model() 获得参数“nr_class”的多个值 - SpaCy 多分类模型（BERT 集成）的相关文章