ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误

2024-04-28

def split_data(path):
  df = pd.read_csv(path)
  return train_test_split(df , test_size=0.1, random_state=100)

train, test = split_data(DATA_DIR)
train_texts, train_labels = train['text'].to_list(), train['sentiment'].to_list() 
test_texts, test_labels = test['text'].to_list(), test['sentiment'].to_list() 

train_texts, val_texts, train_labels, val_labels = train_test_split(train_texts, train_labels, test_size=0.1, random_state=100)

from transformers import DistilBertTokenizerFast
tokenizer = DistilBertTokenizerFast.from_pretrained('distilbert-base-uncased

train_encodings = tokenizer(train_texts, truncation=True, padding=True)
valid_encodings = tokenizer(valid_texts, truncation=True, padding=True)
test_encodings = tokenizer(test_texts, truncation=True, padding=True)

当我尝试使用 BERT 分词器从数据帧中拆分时，我收到了这样的错误。

我有同样的错误。问题是我的列表中没有，例如：

from transformers import DistilBertTokenizerFast

tokenizer = DistilBertTokenizerFast.from_pretrained('distilbert-base-german-cased')

# create test dataframe
texts = ['Vero Moda Damen Übergangsmantel Kurzmantel Chic Business Coatigan SALE',
         'Neu Herren Damen Sportschuhe Sneaker Turnschuhe Freizeit 1975 Schuhe Gr. 36-46',
         'KOMBI-ANGEBOT Zuckerpaste STRONG / SOFT / ZUBEHÖR -Sugaring Wachs Haarentfernung',
         None]

labels = [1, 2, 3, 1]

d = {'texts': texts, 'labels': labels} 
test_df = pd.DataFrame(d)

因此，在将 Dataframe 列转换为列表之前，我删除了所有 None 行。

test_df = test_df.dropna()
texts = test_df["texts"].tolist()
texts_encodings = tokenizer(texts, truncation=True, padding=True)

这对我有用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误的相关文章

决策树和规则引擎 (Drools)

In the application that I m working on right now I need to periodically check eligibility of tens of thousands of object
Spark scala 模拟 Spark.implicits 用于单元测试

当尝试使用 Spark 和 Scala 简化单元测试时我使用 scala test 和mockito scala 以及mockito Sugar 这只是让你做这样的事情 val sparkSessionMock mock SparkSes
mybatis：使用带有 XML 配置的映射器接口作为全局参数

我喜欢使用 XML 表示法来指定全局参数例如连接字符串我也喜欢 Mapper 注释当我尝试将两者结合起来时我得到这个例外 https stackoverflow com questions 4263832 type interfac
使用 Ruby aws-sdk 跟踪文件到 S3 的上传进度

首先我知道SO中有很多与此类似的问题在过去的一周里我读了大部分如果不是全部但我仍然无法让这项工作为我工作我正在开发一个 Ruby on Rails 应用程序允许用户将 mp3 文件上传到 Amazon S3 上传本身工作正常
如何在连接到 Heroku PostgreSQL 的 Flask 应用程序上处理更多并发用户？

Heroku 上的 Flask API 有许多端点它们在将 json 化结果返回给客户端之前在我的 Heroku PostgreSQL 数据库上运行查询我当前的计划是 Hobby Basic 层因此数据库最多只能处理 20 个连接如
Matplotlib loglog 的错误刻度/标签（双轴）

我正在使用 matplotlib 创建对数图如下图所示默认刻度选择得很糟糕充其量是这样右边的 y 轴甚至根本没有在线性等效中确实如此而两个 x 轴都只有一个有没有办法获得合理数量的带有标签的刻度 without为每个情节手动指
Jquery 以编程方式更改
文本

编辑解决方案是将其添加到个人资料页面而不是性别页面 profile live pageinit function event p pTest text localStorage getItem gender 我在列表视图中有一个带有一些文
将客户端库添加到 Razor 类库

我正在学习 Blazor 我注意到创建 Razor 类库是一个很好的做法您将在其中定义大部分组件这样您就可以在客户端或服务器中使用它们而不会出现太多问题在不同的框架中我习惯于以 SASS 形式包含库作为引导程序这样我就可以在我的
区分 NaN 输入和输入类型为“number”的空输入

我想使用 type number 的表单输入并且只允许输入数字
$ 在 JQuery 中意味着什么

在下面的 var obj one 1 two 2 three 3 four 4 five 5 each obj function i val console log val 这里是什么意思是对象吗是一个别名jQuery对象函数它充当
如何将 SQLite 数据库捆绑到 Go 二进制文件中？

我尝试使用 go bindata 和 packr 但这些包没有显示如何将 SQLite 数据库文件打包到二进制文件中我不需要以任何方式更新数据库我只想在启动时从中读取数据如何将 SQLite 数据库文件嵌入到 Go 二进制文件中 SQ
在DialogFragment中，onCreate应该做什么？

我目前正在摆弄 DialogFragment 以学习使用它我假设相比onCreateView onCreate 可以这样做 public void onCreate Bundle savedInstanceState super onCr
即使在急切加载之后，belongs_to 关联也会单独加载

我有以下关联 class Picture lt ActiveRecord Base belongs to user end class User lt ActiveRecord Base has many pictures end 在我的
如何禁用 solr 管理页面

对于生产来说拥有一个甚至不要求登录凭据的 solr 管理员感觉不安全如何禁用默认的 solr 管理页面我只是希望我的 web 应用程序使用 Solr 进行搜索词索引我强烈建议保留管理页面用于调试目的它在很多情况下拯救了我有多种方
进程被杀死后不会调用 onActivityResult

我有一个主要活动 Main 和另一个活动 Sub 由 Main 调用 startActivityForResult new Intent this SubActivity class 25 当我在 Sub 时我终止该进程使用任务管理器或
在成为FirstResponder或resignFirstResponder的情况下将对象保持在键盘顶部？

我目前在键盘顶部有一个 UITextField 当您点击它时它应该粘在键盘顶部并平滑地向上移动我不知道键盘的具体时长和动画类型所以确实很坎坷这是我所拥有的 theTextView resignFirstResponder UIVie
水平和垂直居中 div 位于页面中间，页眉和页脚粘在页面顶部和底部

我正在尝试制作一个具有固定高度页眉和页脚的页面页眉位于屏幕顶部 100 宽度页脚位于底部 100 宽度我想将一个具有可变高度内容的 div 居中放置在页眉和页脚之间的空间中在下面的 jsfiddle 中如果内容比空格短它会起作用
java中void的作用是什么？

返回类型方法返回值的数据类型如果方法不返回值则返回 void http download oracle com javase tutorial java javaOO methods html http download oracle
是否可以使用 Dapper 流式传输大型 SQL Server 数据库结果集？

我需要从数据库返回大约 500K 行请不要问为什么然后我需要将这些结果保存为 XML 更紧急并将该文件通过 ftp 传输到某个神奇的地方我还需要转换结果集中的每一行现在这就是我正在做的事情 TOP 100结果使用 Dappe
R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p

随机推荐

课程完成时更新外部数据库

我的场景 Moodle 中的用户完成了一门课程一旦发生这种情况我想更新外部数据库我的理解是每次运行 cron 作业时都会触发 course completed 事件使用一些简单值例如已完成课程的用户名 ID 课程 ID 以及完成
int i 与 int index 等哪个更好？ [复制]

这个问题在这里已经有答案了可能的重复名为 i 的变量是不可接受的吗 https stackoverflow com questions 130775 is a variable named i unacceptable 循环变量的理想变
如何在mavenrelease:prepare和release:perform上排除文件？

我正在使用 Maven 来发布标记我的项目并且我正在使用一些属性文件并希望 mvn prepare 排除那些正在发布的项目我尝试使用以下命令 mvn release prepare DpreparationGoals clean in
php 如何使用 getimagesize() 检查上传时的图像类型[重复]

这个问题在这里已经有答案了可能的重复 GetImageSize 在应该返回 FALSE 时没有返回 FALSE https stackoverflow com questions 10464948 getimagesize not ret
机器人可以从用户处接收图像作为消息或附件吗

我希望用户能够将图像作为消息发送给机器人这可能吗我在网上搜索了解决方案但我很累请有人至少可以分享给我一个链接吗 Yes 来自nodejs文档here https learn microsoft com en us azure bot
计算距另一对纬度/经度坐标特定距离的纬度/经度坐标[重复]

这个问题在这里已经有答案了我的应用程序需要能够获取用户的起始位置然后计算距该点在所有方向的特定距离的纬度经度坐标有谁知道我如何实现这个目标我在此链接上找到了答案将 CLLocation 移动 x 米 https stackov
如何访问 RStudio 中的脚本/源历史记录？

我想访问 RStudio 源面板中输入内容的历史记录我对我们学习和输入代码的方式感兴趣我想分析的三件事是 i 一个人输入代码的方式 ii 不同的人如何输入代码 iii 初学者提高打字的方式作为第一次尝试以这种方式获取命令的历史记录是
如何使用循环自动填充表单上的文本框？

所以我有一个表其中包含我试图在表单上显示的总计列表我需要从总计表中获取 10 个总计并显示在表单上的 10 个文本框中这10个文本框分别是 A1 A2 A3 及其使用DLookup查找 ID 字段编号这似乎是一个语法问题Me TEX
如何在 redux-toolkit 中正确使用 PayloadAction 和元类型？

简化示例 import createSlice PayloadAction from reduxjs toolkit type Cake flavor string size S M L const initialState all Cak
绑定到父 ListViewItem 的 IsSelected 属性

我正在尝试绑定一个的 Visibility 属性TextBlockListView 的 ItemTemplate 中保存的 TextBlock 父 ListViewItem 的 IsSelected 属性使用此标记 TextBlock 始
由于 jaas.conf 不正确而导致 Kafka TopicAuthorizationException

我指的是JAAS登录配置文件 https docs oracle com javase 7 docs technotes guides security jgss tutorials LoginConfigFile html 它讨论了两种指
Hadoop 安全模式恢复 - 花费太长时间！

我有一个包含 18 个数据节点的 Hadoop 集群我在两个多小时前重新启动了名称节点并且名称节点仍处于安全模式我一直在寻找为什么这可能花费太长时间但找不到好的答案发帖在这里 Hadoop 安全模式恢复花费大量时间 https
如何在android中使用webview明智地显示Html内容页面？

您好我创建了一个简单的应用程序来在 webview 中显示 html 页面我使用 webview 并显示页面加载时间如下所示此后禁用滚动并使用下一个和上一个按钮来后退和前进包含所以我的代码如下首先onCreate显示添加webv
swift 字典嵌套数组操作 - 无法改变字典内的嵌套数组

var dict alpha a b c d output alpha a b c d var alphaList dict alpha output a b c d alphaList removeAtIndex 1 output Som
Android facebook sdk appinvites AppInviteDialog 白屏

Hi im having this problem when i try to send facebook appinvites from my android app it just hangs on this white dialog
bootstrap-vue 与 b 表中的复选框相关的问题

我在使复选框正常工作时遇到问题为选定槽中的每一行呈现的复选框未绑定到正确的行当您单击该复选框时它将顶行的复选框设置为真假位置问题 1 如何将行复选框的真假状态绑定到其行项目我试图将其绑定到 data item select
CommandBehavior.SequentialAccess 是否有任何性能提升？

我意识到我总是按照索引返回的顺序读取字段使用常量所以据我所知我的代码已经与 CommandBehavior SequentialAccess 兼容如果我打开它会有什么好处吗 DataReader 已经是只向前只读这才是真正的性能
查找包含具有指定名称的列的所有表 - MS SQL Server

想要改进这篇文章吗提供此问题的详细答案包括引用和解释为什么你的答案是正确的不够详细的答案可能会被编辑或删除是否可以查询包含以下列的表名 LIKE myName 搜索表 SELECT c name AS ColumnName SCHE
Arduino C++ 析构函数？

我知道在Arduino中你不能使用delete 那么什么时候调用 C 类中定义的析构函数呢同样如果我想创建一个指向数组的指针我必须使用malloc and free 当对象被销毁时析构函数被调用对于自动堆栈上变量它在离开其作
ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误

def split data path df pd read csv path return train test split df test size 0 1 random state 100 train test split data

ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误

ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误 的相关文章

随机推荐

热门标签

ValueError：TextEncodeInput 必须是 Union[TextInputSequence，Tuple[InputSequence，InputSequence]] - 标记 BERT / Distilbert 错误的相关文章