“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids

2024-03-06

我训练了一个基于 BERT 的编码器解码器模型（EncoderDecoderModel) named ed_model使用 HuggingFace 的变压器模块。

我用的是BertTokenizer命名为input_tokenizer

我用以下方法标记了输入：

txt = "Some wonderful sentence to encode"
inputs = input_tokenizer(txt, return_tensors="pt").to(device)
print(inputs)

输出清楚地表明input_ids是返回字典


{'input_ids': tensor([[ 101, 5660, 7975, 2127, 2053, 2936, 5061,  102]], device='cuda:0'), 'token_type_ids': tensor([[0, 0, 0, 0, 0, 0, 0, 0]], device='cuda:0'), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1]], device='cuda:0')}

但是当我尝试预测时，我收到此错误：ed_model.forward(**inputs)

ValueError：您必须指定 input_ids 或 input_embeds

有任何想法吗？

嗯，显然这是一个已知问题，例如：本期T5 https://github.com/huggingface/transformers/issues/3626

问题是代码中可能存在重命名过程，因为我们使用编码器-解码器架构，所以我们有 2 种类型的输入 id。

解决办法是显式指定输入id的类型

ed_model.forward(decoder_input_ids=inputs['input_ids'],**inputs)

我希望它被记录在某个地方，但现在你知道了:-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bertlanguagemodel

huggingfacetransformers

“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids 的相关文章

使用huggingface Trainer 与分布式数据并行

为了加快性能我研究了 pytorch分布式数据并行并尝试将其应用于变压器Trainer The DDP 的 pytorch 示例指出这应该at least更快 DataParallel是单进程多线程只能在单机上运行而Distribu
pytorch 摘要因 Huggingface 模型而失败

我想要一个总结PyTorch从huggingface下载的模型我在这里做错了什么吗 from torchinfo import summary from transformers import AutoModelForSequenceCl
更新标记生成器后，LineByLineTextDataset 继续加载

更新标记生成器后当我运行此行时数据集 LineByLineTextDataset tokenizer bert tokenizer file path some file txt 块大小 128 它会永远加载这是完整的代码 from
BERT 微调后得到句子级嵌入

我遇到了这个page https colab research google com github google research bert blob master predicting movie reviews with bert on
您可以使用特定于任务的架构从头开始训练 BERT 模型吗？

基本模型的 BERT 预训练是通过语言建模方法完成的其中我们屏蔽句子中一定百分比的标记然后让模型学习那些缺失的屏蔽然后我认为为了完成下游任务我们添加一个新初始化的层并对模型进行微调然而假设我们有一个巨大的句子分类数据集理论上
Huggingface Transformer 问题答案置信度得分

我们如何从huggingface转换器问题答案的示例代码中获取答案置信度得分我看到管道确实返回了分数但是下面的核心也可以返回置信度分数吗 from transformers import AutoTokenizer TFAutoMode
如何更改 Huggingface 变压器默认缓存目录

默认缓存目录磁盘容量不足我需要更改默认缓存目录的配置您可以在每次加载模型时指定缓存目录 from pretrained https huggingface co transformers main classes model html
UnparsedFlagAccessError：在解析标志之前尝试访问标志 --preserve_unused_tokens。伯特

我想使用 Bert 语言模型来训练多类文本分类任务之前我使用 LSTM 进行训练没有任何错误但 Bert 给了我这个错误我收到以下错误我真的不知道如何解决它有人可以帮助我吗不幸的是 keras 库中使用 BERT 的文档很少
如何从 pytorch 模块获取子模块序列？

对于火炬module https pytorch org docs master generated torch nn Module html 我想我可以用 named children named modules等来获取子模块的列表但是
Huggingface 保存标记器

我正在尝试将标记生成器保存在 Huggingface 中以便稍后可以从不需要访问互联网的容器中加载它 BASE MODEL distilbert base multilingual cased tokenizer AutoTokenize
在 Mac OS 上从 Transformer 类导入管道函数时，Jupyter 内核崩溃

我无法导入 Transformer 类的管道函数因为我的 jupyter 内核一直死机尝试使用 Transformer 4 15 0 和 4 16 2 有人遇到过这个问题吗我尝试将类导入到新笔记本中如图所示它不断杀死内核这对我来
为什么 Bert Transformer 使用 [CLS] 令牌进行分类而不是对所有令牌进行平均？

我正在对 bert 架构进行实验发现大多数微调任务都将最终的隐藏层作为文本表示然后将其传递给其他模型以进行进一步的下游任务 Bert 的最后一层如下所示我们获取每个句子的 CLS 标记图片来源 https jalammar gith
在微调 GPT-2 模型时如何处理堆栈期望每个张量具有相同大小的误差？

我尝试用我的个人信息微调模型所以我可以创建一个聊天框人们可以通过聊天 gpt 了解我但是我得到了错误 RuntimeError 堆栈期望每个张量大小相等但在条目 0 处得到 47 在条目 1 处得到 36 因为我有不同的输入长度
为什么将模型上传到 HuggingFace 存储库的速度如此之慢？

我有一个问题我正在尝试将模型推送到 HuggingFace 存储库问题是它说上传过去 16 小时而这只是 pytorch model bin 文件大约 850MB 我用的是LFS 我尝试手动将文件添加到存储库这需要很长时间我不愿
BertTokenizer.from_pretrained 错误并显示“连接错误”

我正在尝试从 Huggingface 下载 BERT 的分词器我正在执行 tokenizer BertTokenizer from pretrained bert base uncased Error
下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误

def split data path df pd read csv path return train test split df test size 0 1 random state 100 train test split data
如何使用 Huggingface 变压器加载基于 llama 的微调 pef/lora 模型？

我已经关注了this https www youtube com watch v Us5ZFp16PaU教程 Colab笔记本 https colab research google com drive 14xo6sj4dARk8lXZbO
应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下

随机推荐

SyntaxError：解析错误仅发生在 safari 中

我收到 SyntaxError Parse Error 仅在 safari 上这是有问题的代码
MySql PHP 从逗号分隔的数据（标签）中选择不同值的计数

如何从 MySql 中以逗号分隔值存储的数据中选择不同值的计数最后我将使用 PHP 从 MySql 输出数据里面有每个帖子的标签所以最后我尝试输出数据就像 stackoverflow 处理标签的方式一样如下所示 tag name
将 setIcon 首选项设置为 ColorDrawable 在 Android 5.0 Lollipop 上不起作用

在我的应用程序中我使用以下行来区分一些首选项 preference setIcon new ColorDrawable color 在 Lollipop 之前的 Android 版本中它工作正常并且首选项显示所选颜色的方形图标但在
将共享库打包到 elf 中 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有一个实用程序可以ALL精灵需要的SO将它们变成静态然后将精灵转换为SO的自由以下是一些您可能会
共享目标通用应用程序 Windows 10 方法

我为此苦苦挣扎了几个小时但找不到有效的解决方案我的应用程序是共享的目标应用程序问题是当它运行并且用户想要共享内容时 protected override async void OnShareTargetActivated ShareT
.* 有什么作用？正则表达式实际上意味着什么？

我使用 Perl 已有十年了但最近我对使用感到困惑正则表达式它似乎与最小字符数不匹配有时它会给出不同的结果例如对于此字符串 aaaaaaaaaaaaaaaaaaaaaaammmmmmmmmmmbaaaaaaaaaaaaaaaa
是否可以使用整数算术实现按位运算符？

我面临着一个相当特殊的问题我正在为不支持按位运算的体系结构开发编译器然而它处理带符号的 16 位整数算术我想知道是否可以仅使用以下方法来实现按位运算 Addition c a b 减法 c a b Division c a b 乘法
在 iPhone / Objective-c 上读取/写入图像 XMP

我正在尝试从 iPhone 上的 jpeg 读取 XMP 信息我可以使用 ImageIO 轻松从 IPTC TIFF 或 EXIF 获取标签但不能使用 XMP 我对评级标签特别感兴趣有谁知道这是怎么做到的吗我自己也一直在尝试解决这个
Oracle JOIN USING + 子查询：ora-00904 字符串：无效标识符

我的查询中有一点语法问题简化 select from table1 t1 inner join table2 t2 using pk1 inner join table3 t3 using pk2 where not exists sel
Flutter 中将 Json 数组转换为 List
我是 Flutter 和 Dart 的新手我一直在努力保存共享首选项中的值以便在我的应用程序重新启动时使用我已成功存储变量但我还需要存储对象列表我知道由于共享首选项仅接受字符串列表因此我需要将对象列表转换为 JSON 数组并

调用命令并使用参数运行 ps1

我正在尝试使用 invoke command 运行脚本来安装端点防御程序以及一些相关参数如果我使用 invoke command 运行标准 ps1 它可以正常工作但是如果我运行以下命令 Invoke Command ComputerN

如何使用 pytest 测试无限 while 循环

我目前正在编写一个与bamboo 构建服务器交互的小库测试是使用 pytest 完成的我陷入了以下问题我想测试一个 while 循环该循环运行直到满足某些状态阅读 pytest 文档我尝试模拟 monkeypatch 状态但

编译时在输出窗口上查看所有命令行

我想在输出窗口上构建释放时查看所有命令当我构建我的应用程序时我只看到这个 Build started Project CemKutuphane Configuration Debug Any CPU CemKutuphane gt D

HWND 可见吗？

那些该死的用户和他们最小化的窗口在 C 中如果我有一个窗口的 HWND 有没有办法判断它在桌面上是否可见 The GetWindowPlacement http msdn microsoft com en us library ms63

使用 VSTS 的 REST api 更新构建定义时出现问题

我想更新构建定义中的变量但是当它尝试运行时Invoke RestMethod我收到以下异常 Invoke RestMethod id 1 innerException null message This request expects a

如何从 Jenkins 声明式和脚本化管道内的 POM 中提取版本 ID？

我已经创建了一个管道并使用嵌入式 groovy 管道脚本定义但似乎无法从 POM 获取项目的版本 ID 我尝试了这个它在 groovy 控制台中工作但在 Jenkins 构建管道脚本中工作 def project new XmlSlu

为什么要在对象上调用终结器

下面的示例程序表现出令人惊讶的最终行为 class Something public void DoSomething Console WriteLine Doing something Something Console WriteLin

如何正确更新使用 pygame 单独绘制的 100 个类对象的位置和速度？

我正在看这个视频https www youtube com watch v mhjuuHl6qHM https www youtube com watch v mhjuuHl6qHM通过 The Coding Train 我想如果我用 P

在 Qt 中使用 .pri 文件

这是这个问题的后续如何在qt creator中为项目创建子目录 https stackoverflow com questions 1176666 how to create a subdirectory for a project in

“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids

我训练了一个基于 BERT 的编码器解码器模型 EncoderDecoderModel named ed model使用 HuggingFace 的变压器模块我用的是BertTokenizer命名为input tokenizer 我用以下
热门标签

菜单函数

自动构建

prot

代码覆盖率检查工具

istanbul

推出基于

想自己造无人机吗

数据读取与处理

这款降落伞带你飞

无人机炸机再不怕

掘金技术征文

格式化自动加分号问题

下载历史版本

怎么解决循环依赖

中的循环依赖

月色血风暴

面试组合技

搭建点播视频

面试问题及答案

扫描结果的保存和输出

消息不实

中主启动类
Powered by Hwhale

“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids

“您必须指定 input_ids 或 input_embeds”，但我确实指定了 input_ids 的相关文章

随机推荐

热门标签