re.findall() 我想要页面上正则表达式的所有唯一实例

2024-04-09

正如标题所示，我想运行这样的代码（top_url_list 只是我循环查找的 url 列表，以查找我正在使用正则表达式查找的这些文件名约定的实例：

    name_files = []
    for i in top_url_list:
        result = re.findall("\/([a-z]+[0-9][0-9]\W[a-z]+)", str(urlopen(i).read()))

目标是获取正则表达式检查的所有实例，因此使用“findall()”函数。问题是，重要的是我只获取每个实例的不同/唯一性。这可能吗？

re.findall() https://docs.python.org/2/library/re.html#re.findall gives 字符串中模式的非重叠匹配，作为字符串列表。您可以使用将其转换为唯一值set() https://docs.python.org/2/library/functions.html#func-set。有关如何进行的示例set() works:

>>> my_list = [1, 5, 2, 5, 2, 7]
>>> set(my_list)
set([1, 2, 5, 7])  # Duplicate entries of 5 and 2 are removed

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

findAll

re.findall() 我想要页面上正则表达式的所有唯一实例的相关文章

从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
如何为未捕获的异常处理程序编写单元测试

我有一个函数可以捕获uncaught例外情况如下有没有办法编写一个单元测试来执行uncaught exception handler 功能正常但测试正常退出 import logging def config logger logge
尝试从网页Python和BeautifulSoup获取编码

我试图从网页检索字符集这会一直改变目前我使用 beautifulSoup 来解析页面然后从标题中提取字符集这工作正常直到我遇到一个网站到目前为止我的代码以及与其他页面一起使用的代码是 def get encoding soup
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
python celery -A 的无效值无法加载应用程序

我有一个以下项目目录 azima init py main py tasks py task py from main import app app task def add x y return x y app task def mul
OpenCV 跟踪器：模型未在函数 init 中初始化

在视频的第一帧我运行一个对象检测器它返回对象的边界框如下所示
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
使用标签或 href 传递 Django 数据

我有一个包含链接的表当单击该链接进行更多操作时我想将一些数据传递给我的函数 my html table tbody for query in queries tr td value a href internal my func que
为什么这个 if 语句会导致语法错误

我正在尝试设置一个 elif 语句如果用户按下 Enter 键代码将继续但是我不断遇到语法错误 GTIN 0 while True try GTIN int input input your gtin 8 number if len
使用seaborn绘制简单线图

我正在尝试使用seaborn python 绘制ROC曲线对于 matplotlib 我只需使用该函数plot plt plot one minus specificity sensitivity bs where one minus s
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
PyInstaller“ValueError：源代码字符串不能包含空字节”

我得到了一个ValueError source code string cannot contain null bytes执行命令时pyinstaller main py在具有和不具有管理员权限的cmd中 Traceback most re
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
寻找完美的正方形

我有这个Python代码 def sqrt x ans 0 if x gt 0 while ans ans lt x ans ans 1 if ans ans x print x is not a perfect square return
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
使用 paramiko 运行 Sudo 命令

我正在尝试执行sudo使用 python paramiko 在远程计算机上运行命令我尝试了这段代码 import paramiko ssh paramiko SSHClient ssh set missing host key polic

随机推荐

如何从 Twitter 的 firebase 用户获取 @user

我试图在通过 firebase 登录 Twitter 后访问 Twitter 用户名但 getDisplayName 方法返回用户名而不是有任何想法吗我已经尝试过这个 FirebaseAuth getInstance getCurr
如何找出一个类属于哪个依赖项？

我正在使用 m2eclipse 我想在新项目中重用以前项目的一些依赖项我知道我想使用哪个类但我似乎无法找出它到底属于哪个依赖项如果 eclipse 只是告诉我它从中加载的 jar 的名称我会很高兴我怀疑有一种方法可以在 Eclip
如何获取字典中的键列表？

我只想要字典的键而不是值我还无法获得任何代码来执行此操作事实证明使用另一个数组的工作量太大因为我也使用了删除如何获取字典中的键列表 Use the Dictionary
int 可以别名为 unsigned int 吗？ [复制]

这个问题在这里已经有答案了编译器生成代码假设int可以通过一个别名unsigned int 下面的代码 int f int a unsigned int b a 10 b 12 return a int f int a double b
为什么这种双重检查锁定是正确的？（。网）

我读过很多关于双重检查锁定的危险的文章我会尽力避免它但话虽如此我认为他们读起来非常有趣我正在阅读 Joe Duffy 的这篇关于使用双重检查锁定实现单例的文章 http www bluebytesoftware com blog P
在 iPhone 上复制并粘贴多种数据表示形式

当我尝试将多个数据表示放到 iPhone 3 0 的粘贴板上时遇到了一些问题我想做的是将数据表示形式和字符串表示形式放到粘贴板上数据是我自己的数据类型我用它来复制和粘贴到我的应用程序中字符串表示形式是一种将应用程序的内容作为大纲复
如何配置具有两个端点的 WCF 服务，以便为每个端点使用不同的 ListenUri？

我有一个 WCF 服务它使用以下方式公开端点webHttpBinding并由 WPF 和 ASP NET 应用程序使用一切都很好我现在尝试从 Windows Phone WP7 使用该服务然而由于 NET Framework 还没
如何在 firebase auth web 中存储用户名和 photourl

我正在尝试 firebase 身份验证我想在用户注册时存储照片网址和用户名我的注册代码 const email signupForm email value const password signupForm password valu
使用 AVMutableVideoComposition 时 AVMutableComposition 冻结的奇怪行为

我正在尝试使用合并多个视频AVMutableComposition 我面临的问题是每当我尝试添加任何AVMutableVideoComposition为了应用任何指令我的播放冻结在AVPlayer持续时间正好 6 秒另一个有趣的事情是
python-Binance api：APIError（代码=-1013）：过滤失败：LOT_SIZE

当尝试使用 python binance api 下买卖订单时出现以下错误 APIError code 1013 Filter failure LOT SIZE 现在我看到了冰山零件 https github com binance ex
Xcode：如何在应用程序中一次更改所有字体？

我想知道是否可以同时更改大约 100 个不同视图控制器上的字体这比一件一件地检查并改变它们要容易得多有任何想法吗谢谢你用户界面文件 xib 是纯文本您可以将它们加载到编辑器中在左侧窗格中的 Xcode4 中您可以右键单击 gt
以编程方式在 ActiveReports 中插入分页符

我一直在网上寻找一个很好的例子但无法弄清楚如何以编程方式向 ActiveReports 报表添加分页符我正在处理的报告通常需要每条记录 1 2 页为了支持报告的双面打印我想为使用奇数页的每个记录插入一个空白页确保每个新记录都打印在
TFS 2015（本地）vNext 构建失败，但 xaml 构建有效

我已经为 TFS 2015 配置了新的构建服务器我的 Xaml 构建运行得很好但 vNext 构建始终停留在等待可用代理状态代理池为绿色仅配置了一个构建代理我已多次删除和配置代理但没有成功更新1 我从代理日志中得到了这个
预扫描网页进行动态测试

寻找 JeffTanner 提出的问题的明确答案here https stackoverflow com questions 69095677 cypress adding tests dynamically within a wrap a
如何在 R markdown 中生成没有前导码的 LaTeX 文件？

我有一个 LaTeX 文档它被分割成多个 tex files 我正在使用 R markdown 生成图形和表格是否可以从 Rmd 生成没有前导码的 tex 文件以便我能够在文档中使用输出目前我需要手动将部分输出复制到我的 tex
更改单个折线图系列颜色 JavaFX

我有一个窗口其中包含三个不同的折线图我试图单独设置每个折线图系列的颜色现在我有一个 css 文件内容如下 default color0 chart series line fx stroke blue default color1
如何在ios中生成UUID

如何在 Objective C 中获取 UUID 就像在 Java 中一样 UUID 用于生成代表 128 位值的唯一随机数 Try CFUUIDRef udid CFUUIDCreate NULL NSString udidString
在 gradle.properties 文件中使用环境变量

我正在尝试设置 org gradle java home 属性gradle properties文件来在 Java 8 上运行我的 Gradle 项目而我的系统的其余部分使用 Java 7 因此 JAVA HOME指向 JDK 7 而不是
如何使用 apply.daily/period.apply 计算 XTS 时间序列中每列的最大值？

我在使用时遇到问题period apply函数适用于我的高分辨率时间序列分析案例我想以 10 分钟为间隔计算数据的统计数据不同时期的平均值标准差等计算每小时的平均值工作正常如中所述这个答案 https stackoverflow
re.findall() 我想要页面上正则表达式的所有唯一实例

正如标题所示我想运行这样的代码 top url list 只是我循环查找的 url 列表以查找我正在使用正则表达式查找的这些文件名约定的实例 name files for i in top url list result re find

re.findall() 我想要页面上正则表达式的所有唯一实例

re.findall() 我想要页面上正则表达式的所有唯一实例 的相关文章

随机推荐

热门标签

re.findall() 我想要页面上正则表达式的所有唯一实例的相关文章