在非单一维度 1 处，张量 a (707) 的大小必须与张量 b (512) 的大小匹配

2023-11-24

我正在尝试使用预训练的 BERT 模型进行文本分类。我在我的数据集上训练了模型，并在测试阶段；我知道 BERT 只能接受 512 个标记，因此我编写了 if 条件来检查数据帧中测试语句的长度。如果它比 512 长，我将句子分成序列，每个序列有 512 个标记。然后进行分词器编码。序列的长度是 512，但是，在进行 tokenize 编码后，长度变为 707，并且出现此错误。

The size of tensor a (707) must match the size of tensor b (512) at non-singleton dimension 1

这是我用来执行前面步骤的代码：

tokenizer = BertTokenizer.from_pretrained('bert-base-cased', do_lower_case=False)
import math

pred=[]
if (len(test_sentence_in_df.split())>512):
  
  n=math.ceil(len(test_sentence_in_df.split())/512)
  for i in range(n):
    if (i==(n-1)):
      print(i)
      test_sentence=' '.join(test_sentence_in_df.split()[i*512::])
    else:
      print("i in else",str(i))
      test_sentence=' '.join(test_sentence_in_df.split()[i*512:(i+1)*512])
      
      #print(len(test_sentence.split()))  ##here's the length is 512
    tokenized_sentence = tokenizer.encode(test_sentence)
    input_ids = torch.tensor([tokenized_sentence]).cuda()
    print(len(tokenized_sentence)) #### here's the length is 707
    with torch.no_grad():
      output = model(input_ids)
      label_indices = np.argmax(output[0].to('cpu').numpy(), axis=2)
    pred.append(label_indices)

print(pred)

这是因为，BERT 使用单词片段标记化。因此，当某些单词不在词汇表中时，它将单词分割成单词片段。例如：如果这个词playing不在词汇表中，它可以分解为play, ##ing。这会增加标记化后给定句子中的标记数量。您可以指定某些参数来获得固定长度的标记化：

tokenized_sentence = tokenizer.encode(test_sentence, padding=True, truncation=True,max_length=50, add_special_tokens = True)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在非单一维度 1 处，张量 a (707) 的大小必须与张量 b (512) 的大小匹配的相关文章

如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块？

我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时也是由 CDK 创建的这是我的 CDK 堆栈代码 fr
如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户

随机推荐

如何在刷新页面时抑制重新发布 - ASP.NET MVC

我正在使用 asp net mvc 构建一个向导目前当用户点击下一个或上一个时表单值将被发布到一个操作该操作执行所需的任何处理然后呈现下一个视图我遇到的问题是如果用户在新视图中点击刷新他们会被提示重新发布表单值这会导致
兼容 x86 的英特尔至强融核加速器中是否有 SIMD(SSE / AVX) 指令？

x86 兼容加速器 MIC Intel Xeon Phi 中是否有 SIMD SSE AVX 指令 http en wikipedia org wiki Xeon Phi 是的最新一代的英特尔至强融核协处理器代号骑士角缩写 KNC
如何使用伪 CGO 指令在子目录中添加 C 文件作为 go build 的一部分？

根据文档 go buildwith cgo 将在包的根目录中添加任何 C C 文件作为编译的一部分有没有办法使用 CGO 指令使给定子目录中的 C C 文件以及根目录中的文件也成为编译的一部分并不真地您唯一的选择是将子目录设为另一个
Flask 路由模式匹配顺序

鉴于Flask 路由不是从上到下进行模式匹配的如何处理以下问题我有以下路线
如何对并行 numpy 数组进行“压缩排序”？

如果我有两个并行列表并想按第一个列表中元素的顺序对它们进行排序这非常简单 gt gt gt a 2 3 1 gt gt gt b 4 6 7 gt gt gt a b zip sorted zip a b gt gt gt print a
从 jQuery 调用 WCF 服务库时出现问题

我通过我的 ASPX 站点公开了一个 WCF 服务库如下所示 System ServiceModel OperationContract System ServiceModel Web WebInvoke Method POST Requ
Java 嵌套泛型类型

为什么必须使用泛型类型Map gt m Doesn t compile public static void test Map gt m 请注意以下方法
如何在执行tensorflow .fit时修复死内核

内核是dead执行时model fit train generator epochs 20 但相同的代码可以在另一台电脑上运行这是一个 Juputer 日志警告 17 03 05 等待单元格完成时出错错误在回复完成之前取消了执行请求
PyCharm 运行工具窗口（运行选项卡窗口）丢失

所以最近我的 PyCharm 缺少通常显示运行调试结果的运行工具窗口它现在被 python 控制台和服务取代这确实令人沮丧因为它只是显示乱码和类似命令提示符的格式如何将运行工具窗口返回为主运行调试窗口我用红色圆圈圈出了这张图片
如何制作静态链接ELF文件来加载LD_PRELOAD .so

我有静态链接的二进制文件 ELF 文件它没有动态段 dymsym 部分并且不执行 LD PRELOAD 命令等我如何创建假虚拟动态段来激活动态加载程序并执行 LD PRELOAD 命令我如何创建假虚拟动态段来激活动态加载程序并执行
是什么导致 FederatedAuthentication.SessionAuthenticationModule 返回 NULL？

我不知道为什么但当我尝试运行 ClaimsTransformer 模块时我的 FederatedAuthentication SessionAuthenticationModule 解析为 NULL 并使我的应用程序崩溃 public
将 PHP 日期发送为 JavaScript 日期格式

我想将 PHP 服务器时间传递给 JavaScript 文件 PHP代码 date default timezone set Australia Perth echo date r JavaScript get time php funct
触摸 UI 对话框中的默认值 - AEM/CQ

对于经典 UI 有一个选项可以设置defaultValue对于字段当用户拖动组件后第一次打开对话框时会向用户显示该字段如果用户清除对话框中的值并保存则在编辑对话框时字段的值不会再次显示对于触摸 UI 对话框找不到等效项defa
Typescript 生成带有“#private;”字段的声明 d.ts 文件

我有一个用 Typescript 编写的库它分布在 2 个文件中一个已编译的 ECMAScript 2015 兼容 Javascript 文件index js和一个 Typescript 声明文件index d ts 我的目标是让 Ja
System.currentTimeMillis 是否总是返回一个 >= 之前调用的值？

https docs oracle com javase 6 docs api java lang System html currentTimeMillis says 返回当前时间以毫秒为单位请注意虽然返回值的时间单位是毫秒但该值
ggplot2：带有映射到两个分类变量组合的颜色和文本标签的箱线图

我想使用数据集中的 ggplot2 创建箱线图densityAGRLKAx 轴上有 3 个分类变量物种地点位置以下功能 ggplot densityAGRLKA aes species density fill location a
如何让 TextBox 只接受 WPF 中的数字输入？

我希望接受数字和小数点但没有符号我查看了使用 Windows 窗体 NumericUpDown 控件的示例并且Microsoft 的 NumericUpDown 自定义控件示例但到目前为止 NumericUpDown 是否受 WPF
C 获取所有打开的文件描述符

我想在我的 C 程序中实现行为以便如果发生 SIGINT 我会关闭所有打开的文件描述符有没有一种简单的方法来获取它们的列表我会使用暴力 for i 0 i lt fd max i close i 快速且相当便携
SSL 与 Grizzly 和 Jersey

我正在尝试让 grizzly 使用 SSL 加密并且仍然可以与 Jersey 一起正常工作我查遍了整个互联网发现 Grizzly 和 Jersey 对 SSL 进行了各种不同的尝试似乎有不同的方法可以实现具体取决于您使用的版本以及
在非单一维度 1 处，张量 a (707) 的大小必须与张量 b (512) 的大小匹配

我正在尝试使用预训练的 BERT 模型进行文本分类我在我的数据集上训练了模型并在测试阶段我知道 BERT 只能接受 512 个标记因此我编写了 if 条件来检查数据帧中测试语句的长度如果它比 512 长我将句子分成序列每个序列

在非单一维度 1 处，张量 a (707) 的大小必须与张量 b (512) 的大小匹配

在非单一维度 1 处，张量 a (707) 的大小必须与张量 b (512) 的大小匹配 的相关文章

随机推荐

热门标签

在非单一维度 1 处，张量 a (707) 的大小必须与张量 b (512) 的大小匹配的相关文章