python正则表达式重复与捕获问题

2024-03-14

使用python3的正则表达式功能，是否可以根据找到的重复次数来捕获可变数量的捕获块？例如，在以下搜索字符串中，我想使用相同的正则表达式捕获所有数字字符串。

搜索字符串 1（尝试捕获：89, 45）：

zzz89zzz45.mp3

搜索字符串 2（尝试捕获：98、67、89、45）：

zzz98zzz67zzz89zzz45.mp3

搜索字符串 3（尝试捕获：98、67、89、45、55、111）：

zzz98zzz67zzz89zzz45vdvd55lplp111.mp3

以下正则表达式将匹配所有重复项，但所有值均不可用于以后使用（仅捕获 1 位数字字符串）：

((\d+)\D*)*\.mp3$

其他 2 个选项是为每种情况编写不同的正则表达式，或者使用 findall()。有没有办法调整上面的正则表达式，以便捕获每个数字字符串，以便以后仅使用正则表达式工具进行不同次数的重复使用，或者在 python3 中执行此操作，您是否被迫使用 findall() ？

大多数或所有常用的正则表达式引擎，特别是基于 PCRE 语法的引擎（例如 Python 的），根据左括号的数字索引来标记其捕获组，正如正则表达式所写。所以不，您不能单独使用捕获组从字符串中提取任意数量的子序列。

你能得到的最接近的（据我所知）是手动写出一定数量的捕获组，如下所示：

s = ...
res = re.match(r'\D*' + 25 * r'(\d+)\D+')
numbers = [r for r in res.groups() if r is not None]

这将为您提供最多 25 组数字。如果您需要更多，请将 25 替换为更大的数字。

如果这比迭代方法的效率低，我不会感到惊讶findall()，虽然我还没有测试过。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python正则表达式重复与捕获问题的相关文章

Django 管理中的嵌套内联？

好吧我有一个相当简单的设计 class Update models Model pub date models DateField title models CharField max length 512 class Post mode
如何在java中使用模式匹配器？

假设字符串是我想提取xyz从字符串中出来我用了 Pattern titlePattern Pattern compile lttitle gt s s lt title gt Matcher titleMatcher titlePatte
我可以将 RegExp 和 Function 存储在 JSON 中吗？

给定一个像这样的块 var foo regexp http fun function 将其存储在 JSON 中的正确方法是什么您必须将 RegExp 作为字符串存储在 JSON 对象中然后您可以从字符串构造一个 RegExp 对象 JS
python 正则表达式中括号的奇怪行为

我正在编写一个 python 正则表达式它可以在文本文档中查找引用的字符串从黑匣子中记录的航空公司飞行员的引用我首先尝试编写具有以下规则的正则表达式返回引号之间的内容如果以 single 打开则仅在以 single 关闭时返回
正则表达式删除2个字符串之间的所有内容

我的replaceAll 需要一个正则表达式来删除2 个字符串和字符串本身之间的所有内容例如如果我有类似的东西 stackoverflow is really awesome nremove123 n I love it 我试图做一个像
插入失败“OperationalError：没有这样的列”

我尝试使用我尝试修复的姓名和电话创建一个数据库但它会随时向我重播 File exm0 py line 14 in
子字符串替换正则表达式 Notepad++

我正在尝试使用 Notepad 来替换一些文本我是使用正则表达式的新手但遇到了问题替换以下形式的任何模式 CHARACTERS with characters e g SOMEDATA 变成 somedata 这就是我的情况有什么建
如何在 Python 3.x 中删除字符串末尾的数字？

我想从字符串末尾删除数字但我不知道 Can the split 方法工作我怎样才能做到这一点初始字符串看起来像asdfg123 而我只想asdfg反而感谢您的帮助不 split 不起作用因为 split 只能与要分割的固定字符串
Python 函数前的星号[重复]

这个问题在这里已经有答案了我正在关注这个教程 http www pyimagesearch com 2015 04 20 sorting contours using python and opencv comment 405768 ht
Python - ValueError：以 10 为基数的 int() 的文字无效：''

求助当我尝试从字符串中提取整数时我不断收到 ValueError invalidliteral for int with base 10 from string import capwords import sys os import
隐藏控制台并执行 python 脚本

我正在尝试使用 pyinstaller 在 Windows 10 上使用 pyqt5 模块编译在 python 3 中构建的 python 脚本该脚本在运行时隐藏窗口为了编译我的脚本我执行了以下命令 pyinstaller onefi
MySQL 的 read_sql() 非常慢

我将 MySQL 与 pandas 和 sqlalchemy 一起使用然而它的速度非常慢对于一个包含 1100 万行的表一个简单的查询需要 11 分钟以上才能完成哪些行动可以改善这种表现提到的表没有主键并且仅由一列索引 fro
对 Python 的 id() 感到困惑[重复]

这个问题在这里已经有答案了我可以理解以下定义每个对象都有一个身份类型和值对象的身份一旦创建就永远不会改变你可能会认为它是对象在内存中的地址这is操作员比较身份两个物体这id 函数返回一个代表其值的整数身份我假设上面的
Python 3 - 如何从高维数据制作马赛克图？

我有一个 pandas DataFrame data pd read csv r C data path demographics csv sep print data PersonID Married No of Children Sex
使用 Python 的 email.generator 包创建电子邮件草稿

我目前正在使用此代码通过 Python 生成电子邮件 from email import generator from email mime multipart import MIMEMultipart from email mime te
使用动态编程理解正则表达式字符串匹配

我遇到了这个问题要求您实现一个支持的正则表达式匹配器和其中匹配任何单个字符匹配零个或多个前面的元素 isMatch aa a false isMatch aa aa true isMatch aaa aa false isMat
为什么正则表达式不能使用关键字而不是字符？

好吧我几乎不了解 RegEx 基础知识但为什么他们不能将其设计为使用关键字如 SQL 而不是一些神秘的通配符和符号呢由于正则表达式是在运行时解释解析的所以是为了性能吗未编译或者也许是为了写作速度考虑到当您学习一些简单字
根据两个元素对元组列表进行排序[重复]

这个问题在这里已经有答案了我有一个元组列表如下所示 a 4 2 a 4 3 a 7 2 a 7 3 b 4 2 b 4 3 b 7 2 b 7 3 我知道例如要按第二个元素对它们进行排序我可以使用 sorted unsorted k
将 python filedialog 限制为特定文件类型

我创建了以下试用代码来制作一个程序该程序将 Excel 工作表加载到数据框中然后将该数据框保存到另一个 Excel 工作表所有用户选择 import os import pandas from pandas import ExcelW
Python：“取消导入”、“重新导入”、“重置导入”？

我调试在 PyCharm 中一个脚本我在断点处停止然后转到调试控制台窗口然后从那里调用导入行如下所示 import my util1 from my utils 然后我调用 my util1 到目前为止一切都还好然后我更改

随机推荐

如何实现 MVC 4 Web App 服务器端互斥体

我不是 MVC 专家但我相当确定这是可以实现的但是我不知道如何在 MVC 4 中做到这一点为了进行测试我使用了使用 VS 2012 创建网站时提供的默认 Web 应用程序为简单起见请考虑多个用户例如 3 在同一时间点击 Ho
如何使用 Azure CLI 按对象 ID 获取 Azure AD 对象

在 Azure 门户中可以根据对象 ID 查找 Azure AD 对象如下所示是否可以使用 Azure CLI 通过对象 ID 检索 Azure AD 对象为了使用Azure CLI获取与对象ID相关的对象看来我需要提前知道相关资
MVC 我的网址正在创建“？Length=4”

我正在创建一个 MVC4 应用程序我有一个小问题我的代码是 li Html ActionLink Contract Contract Home new id lnk contract li 我正在获取网址 http localhost
Access SQL 查询：获取按日期查找的上一条记录的特定字段

我对 Access 数据库非常陌生我正在尝试为拥有多个加油站的天然气分销公司创建库存数据库每个站都有更多产品气体类型的库存加油站报告其库存包括交易日期售出加仑数加仑交付实际加仑库存预订库存 ActualGallonsIn
如何配置构建类型与产品风格？

基于这个答案https stackoverflow com a 27908019 5156317 https stackoverflow com a 27908019 5156317我有一个后续问题是什么让代表产品风味的应用程序与众不同
我想用 C# 在堆栈上分配一个对象

假设我有这个 C 类 public class HttpContextEx public HttpContext context null public HttpRequest req null public HttpResponse re
doesNotExist at /en-us/ 模板标记无法找到带有查找参数 `{'reverse_id': u'home', 'site': 1} ` 的页面

我目前正在查看 django cms demo 我一直在使用这里找到的代码 https github com andrewschoen django cms demo tree master demo https github com an
Oracle 中的视图是什么？

Oracle 中的视图是什么 A 在 Oracle 中查看在其他数据库系统中它只是存储在内存中的 SQL 语句的表示形式以便可以轻松地重复使用例如如果我们经常发出以下查询 SELECT customerid customername
Google App Engine TextProperty 和 UTF-8：何时编码/解码

我使用的是带有 Django 模板和 Webapp 框架的 Google App Engine 2 5 db TextProperty UTF 8 Unicode 和解码编码让我很困惑我非常感谢一些专家可以提供一些建议我用谷歌搜索了一
NvAPI NVAPI_INTERFACE 缺少显式类型

我是 c cli 新手想为 nvapi 编写一个小型托管包装器现在当尝试访问某些功能时例如 NvAPI Initialize Visual Studio 告诉我该函数未定义 include nvapi h NvAPIStatus N
是否可以使用 popcorn JS 导出带有视频叠加评论的视频？

我正在使用 porpcorn JS 在视频上添加注释我在视频上创建了叠加层并且所有注释都在视频上呈现有什么方法可以导出嵌入 html 内容的视频吗 mp4 文件那么我可以在任何本机播放器例如 VLC 中播放该视频吗你最擅长处理它
c++ - 抽象类的迭代器

我有一个抽象类例如代表几何形状的类我将有继承自的具体类Shape 例如矩形和三角形我想迭代形状组成的点另一个类所以Shape必须为其提供一个接口迭代应该是这样的 for Point p shapeObject some code
访问类库中的 Mustoverride 属性时出现 AccessViolationException

这有点复杂但我会尽力解释清楚我有一个通用代码组件的类库我尝试做一些常见的ConfigurationHandler基类以简化创建自定义配置部分集合和元素我最终得到的是 The ConfigurationSectionBase类是通
Ansible 截断连接字符串

我正在 Ansible 中生成一个 yaml 模板并尝试截断两个连接的字符串这里以下代码不起作用因为连接没有正确地通过管道传输到 regex replace 中我只想要前 n 个字符本例中为前 10 个字符通常我可以将这两个组合
XPages - onkeypress 事件未正确触发点击

我使用 Xpages 自定义控件创建了一个搜索字段 id searchField 和一个搜索按钮 id searchButton 我在搜索字段上添加了一个 onkeypress 事件这样它将触发对 searchButton 的单击然后
如何在图标后对齐多行文本

在带有缩进树数据的表格中我需要将第二行与第一行对齐请注意文本 Tail 与 Long 不对齐在这里创建了一个类似的例子 div width 400px div a href ICon a span This is my figh
Firefox：“加载脚本时出错”

如果我快速单击网站上的不同链接 Asp Net MVC jQuery 完整回发 FireFox 3 下会出现加载脚本错误重现这个错误是相当容易的任务但我不明白为什么会发生每次它都会显示不同的失败脚本文件所有 JavaScrip
Linux 中的 itoa 函数在哪里？

itoa 是将数字转换为字符串的非常方便的函数 Linux下好像没有itoa 是否有等效的功能或者我必须使用sprintf str d num 编辑抱歉我应该记得这台机器绝对是非标准的已经插入了各种非标准libc用于学术目的的实现 A
从 pandas 数据框中删除句子长于特定单词长度的行

我想从 pandas 数据框中删除行其中包含特定列中长度大于所需长度的字符串例如输入帧 X Y 0 Hi how are you 1 An apple 2 glass of water 3 I like to watch movie
python正则表达式重复与捕获问题

使用python3的正则表达式功能是否可以根据找到的重复次数来捕获可变数量的捕获块例如在以下搜索字符串中我想使用相同的正则表达式捕获所有数字字符串搜索字符串 1 尝试捕获 89 45 zzz89zzz45 mp3 搜索字符串 2

python正则表达式重复与捕获问题

python正则表达式重复与捕获问题 的相关文章

随机推荐

热门标签

python正则表达式重复与捕获问题的相关文章