我是一名新手用户,对以下简单的“循环”问题感到困惑。我有一个本地目录,其中包含 x 个文件(大约 500 个 .txt 文件)。我想使用 RAKE for Python 从每个唯一文件中提取相应的关键字。我已经查看了 RAKE 的文档;但是,本教程中建议的代码获取单个文档的关键字。有人可以向我解释如何循环访问本地目录中存储的 X 个文件吗?这是教程中的代码,它对于单个文档来说非常好。
$git clone https://github.com/zelandiya/RAKE-tutorial
import rake
import operator
rake_object = rake.Rake("SmartStoplist.txt", 5, 3, 4)
sample_file = open("data/docs/fao_test/w2167e.txt", 'r')
text = sample_file.read()
keywords = rake_object.run(text)
print "Keywords:", keywords
创建要处理的文件名列表:
filenames = [
'data/docs/fao_test/w2167e.txt',
'some/other/folder/filename.txt',
etc...
]
如果您不想硬编码所有名称,可以使用glob
通过通配符收集文件名的模块。
创建一个字典来存储结果:
results = {}
循环遍历每个文件名,读取内容并将 Rake 结果存储在字典中,按文件名键入:
for filename in filenames:
with open(filename, 'r') as fp:
results[filename] = rake_object.run(fp.read())
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)