如何提取大型文本文件中两个唯一单词之间的信息

2024-03-05

我有大约 150 个充满字符信息的文本文件。每个文件包含两个独特的单词()alpha 和 bravo,我想提取这些独特单词之间的文本并将其写入不同的文件。

我可以手动按 CTRL+F 组合这两个单词并复制它们之间的文本,我只是想知道如何使用程序(最好是 Python)对许多文件执行此操作。


您可以使用常用表达 http://docs.python.org/library/re.html为了那个原因。

>>> st = "alpha here is my text bravo"
>>> import re
>>> re.findall(r'alpha(.*?)bravo',st)
[' here is my text ']

我的 test.txt 文件

alpha here is my line
yipee
bravo

现在使用open http://docs.python.org/tutorial/inputoutput.html#reading-and-writing-files读取文件并应用regular expressions.

>>> f = open('test.txt','r')
>>> data = f.read()
>>> x = re.findall(r'alpha(.*?)bravo',data,re.DOTALL)
>>> x
[' here is my line\nyipee\n']
>>> "".join(x).replace('\n',' ')
' here is my line yipee '
>>>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何提取大型文本文件中两个唯一单词之间的信息 的相关文章

随机推荐