我已经从互联网下载了预训练的手套矢量文件。它是一个 .txt 文件。我无法加载和访问它。使用 gensim 加载和访问词向量二进制文件很容易,但我不知道当它是文本文件格式时该怎么做。
手套模型文件采用词向量格式。您可以打开文本文件来验证这一点。以下是一小段代码,可用于加载预训练的手套文件:
import numpy as np
def load_glove_model(File):
print("Loading Glove Model")
glove_model = {}
with open(File,'r') as f:
for line in f:
split_line = line.split()
word = split_line[0]
embedding = np.array(split_line[1:], dtype=np.float64)
glove_model[word] = embedding
print(f"{len(glove_model)} words loaded!")
return glove_model
然后,您只需使用 gloveModel 变量即可访问词向量。
print(gloveModel['hello'])
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)