re.findall() 我想要页面上正则表达式的所有唯一实例

2024-04-09

正如标题所示,我想运行这样的代码(top_url_list 只是我循环查找的 url 列表,以查找我正在使用正则表达式查找的这些文件名约定的实例:

    name_files = []
    for i in top_url_list:
        result = re.findall("\/([a-z]+[0-9][0-9]\W[a-z]+)", str(urlopen(i).read()))

目标是获取正则表达式检查的所有实例,因此使用“findall()”函数。问题是,重要的是我只获取每个实例的不同/唯一性。这可能吗?


re.findall() https://docs.python.org/2/library/re.html#re.findall gives 字符串中模式的非重叠匹配,作为字符串列表。您可以使用将其转换为唯一值set() https://docs.python.org/2/library/functions.html#func-set。有关如何进行的示例set() works:

>>> my_list = [1, 5, 2, 5, 2, 7]
>>> set(my_list)
set([1, 2, 5, 7])  # Duplicate entries of 5 and 2 are removed
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

re.findall() 我想要页面上正则表达式的所有唯一实例 的相关文章

随机推荐