我有一个 Dataframe,其中每行包含一个句子,后跟一个用 spaCy 创建的词性标签列表:
df.head()
question POS_tags
0 A title for my ... [DT, NN, IN,...]
1 If one of the ... [IN, CD, IN,...]
当我将 DataFrame 写入 csv 文件(encoding='utf-8')并重新打开它时,数据格式似乎已更改,POS 标签现在出现在引号 ' ' 之间,如下所示:
df.head()
question POS_tags
0 A title for my ... ['DT', 'NN', 'IN',...]
1 If one of the ... ['IN', 'CD', 'IN',...]
当我现在尝试使用 POS 标签进行某些操作时,结果发现它们不再是列表,而是变成了甚至包含引号的字符串。它们看起来仍然像列表,但事实并非如此。这样做时这一点很清楚:
q = df['POS_tags']
q = list(q)
print(q)
结果是:
["['DT', 'NN', 'IN']"]
这里发生了什么?
我要么想要专栏'POS_tags' 以包含列表,即使在保存到 csv 并重新打开后也是如此。或者我想对列进行操作 'POS_tags' 再次拥有 SpaCy 最初创建的相同列表。有什么建议如何做到这一点?