I read contents from excel file using pandas::
import pandas as pd
df = pd.read_excel("FAM_template_Update 1911274_JS.xlsx" )
df
在尝试使用 spacy:: 提取实体时
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp(df)
for enitity in doc.ents:
print((entity.text))
得到错误:: TypeError: 参数“string”的类型不正确(预期为 str,得到了 DataFrame)
On line(3)-----> doc = nlp(df)
预计这将是Spacy
不准备按原样处理数据帧。在打印实体之前,您需要做一些工作。首先确定包含您要使用的文本的列nlp
在。之后,将其值提取为列表,现在您就可以开始了。假设包含文本的列名被命名为Text
.
for i in df['Question'].tolist():
doc = nlp(i)
for entity in doc.ents:
print((entity.text))
这将迭代数据框中的每个文本(行)并打印实体。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)