Python re.findall

2024-01-04

我试图检索包含“名称”字段的所有标签，然后处理整个句子加上名称。这是我的测试代码：

sourceCode = '<dirtfields name="one" value="stuff">\n<gibberish name="two"\nwewt>'
namesGroup = re.findall('<.*name="(.*?)".*>', sourceCode, re.IGNORECASE | re.DOTALL)

for name in namesGroup:
    print name

哪个输出是：

two

我想要寻找的输出是

['<dirtfields name="one" value="stuff">', 'one']
['<gibberish name="two"\nwewt>', 'two']

编辑：找到了一种方法来做到这一点，感谢 doublesharp 提供了更干净的方法来获取“名称”值。

namesGroup = re.findall(r'(<.*?name="([^"]*)".*?>)', sourceCode, re.IGNORECASE | re.DOTALL)

这将输出：

('<dirtfields name="one" value="stuff">', 'one')
('<gibberish name="two"\nwewt>', 'two')

你的正则表达式有点不对劲 - 你匹配太多了（一直到最后一个>）。因为您只需要在双引号之间输入值name=使用以下模式：

name="([^"]*)"

name="与您要查找的属性的第一部分匹配
([^"]*)根据任何字符创建分组匹配not双引号
"匹配 name 属性值后面的双引号。

你的代码看起来像这样（最好的形式是包含一个r在你的模式之前）：

namesGroup = re.findall(r'name="([^"]*)"', sourceCode, re.IGNORECASE)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

python27

Python re.findall 的相关文章

Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Perl：正则表达式不抓取代码中的多行 C 风格注释

我有一个 Perl 程序读取用 C 编写的 SRC 文件使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名打开新的目标文件执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释注意这些注释
[A-z0-9]+ 正则表达式匹配方括号[重复]

这个问题在这里已经有答案了我正在努力解决以下正则表达式 A z0 9 如果针对此字符串进行测试 a919238 a asd 它返回a919238 包括方括号我尝试输入我在 regex101 上的测试用例 https www regex1
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
使用鼻子获取设置中当前测试的名称

我目前正在使用鼻子编写一些功能测试我正在测试的库操作目录结构为了获得可重现的结果我存储了一个测试目录结构的模板并在执行测试之前创建该模板的副本我在测试中执行此操作 setup功能这确保了我在测试开始时始终具有明确定义的状态现在
如何从Python中的字符串中提取变量名称和值

我有一根绳子 data var1 id 12345 name John White python中有没有办法将var1提取为python变量更具体地说我对字典变量感兴趣这样我就可以获得变量的值 id和name python 这是由提供
Seaborn Pairplot 图例不显示颜色

我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常但由于某种原因图例不会显示相关的颜色我无法找到解决方案因此如果有人有任何建议请告诉我 x sns pairplot stats2 hue
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
JS用正则表达式替换数字

我有元素的标识符如下所示 form book 1 2 3 我想要的是用其他值替换该标识符中的第二个数字我将函数 match 与以下正则表达式一起使用 var regexp d d d 但它返回我包含的数组 1 2 3 2 因此当我尝试
反向引用在 PHP 中不起作用

最近我一直在研究更多的是在实践中说实话正则表达式我注意到他的力量我提出的这个要求 link https stackoverflow com questions 30380397 take the text up to a speci
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
使用正则表达式查找并替换（批处理.BAT）

我想在多个文本文件中进行查找替换如何使用 BAT 实现自动化我还需要正则表达式示例查找
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
如何在 gulp.src 中使用基本正则表达式？

我正在尝试选择两个文件gulp src highcharts js and highcharts src js 当然我知道我可以使用数组表达式显式添加这两个表达式但出于学习目的我尝试为它们编写一个表达式我读过可以使用简单的正则表达式

随机推荐

显示网络浏览器设置

使用不同的网络浏览器及其版本号字符串以及无数的配置列表确实很痛苦我想知道是否有人想出了一个网页可以将浏览器设置转储到浏览器以便可以保存并转发给开发人员 Thanks 像这样的东西吗 http mybrowserinfo com det
预期是二维数组，却得到一维数组，而是错误

我得到的错误为 ValueError 需要 2D 数组却得到 1D 数组 array 45000 50000 60000 80000 110000 150000 200000 300000 500000 1000000 如果数据具有单个特
委托、Lambda 和 LINQ，天哪！

作为一名相当初级的开发人员我遇到了一个突出我经验不足和知识漏洞的问题如果这里的序言太长请原谅我发现自己参与的一个项目需要学习许多对我而言新技术其中包括 LINQ 用于该项目的 OBJECTS 和 XML 等到目前为止我读到的
如何获取使用“文本数字”的字体的升序或降序高度

我对文本数字有疑问参见维基百科 http en wikipedia org wiki Text figures 在使用以下命令创建的 PDF 文档中itextsharp 基线和数字最低点之间的距离例如9 与字体的正常下降高度不同使用下
验证多态关联模型中的范围唯一性

是的所以我有一个多态关联允许收藏不同的对象类型所以一个人可以喜欢一个产品一个人或者其他什么我想要做的是防止有人使用验证收藏夹模型中的唯一性来复制收藏夹 class Favorite lt ActiveRecord Base be
XMLHttpRequest 与 HttpRequest

有谁知道什么是XMLHttpRequest使网页能够执行普通网页无法完成的操作HttpRequest XMLHttpRequest http en wikipedia org wiki XMLHttpRequest是一个标准的 javas
如何使用 Pandas 的时间戳按小时对数据帧进行分组

我有以下使用时间戳索引的数据帧结构 neg neu norm pol pos date time 1520353341 0 000 1 000 0 0000 0 000000 0 000 1520353342 0 121 0 879 0 2
使用 iText 在横向模式下绘制线条

这是我用来画线的代码 double lineArray annotation getAsArray PdfName L asDoubleArray double x1 lineArray 0 rect getAsNumber 0 doubl
对某一部分贪婪的正则表达式，对其他部分不贪婪的正则表达式

我在 R 中使用正则表达式但我希望它对左侧部分贪婪对右侧部分非贪婪假设我想提取单词 left 和 right 之间的文本但我希望它是贪婪的并继续在文本中查找单词 left 直到找到最后一次出现但是我也希望它不贪婪于正确并在
将 SpatialPolygonsDataFrame 导出为 R 中的 geojson 或 topojson

我正在尝试将伦敦地方当局的 geojson 转换为六角形图表其中每个六边形代表一个地方当局它在 R 中工作但是当我尝试将生成的十六进制网格导出为 geojson 或 topojson 时出现以下错误 Error in sp Spat
实体框架 4.1 检索自引用数据

我首先使用 Entity Framework 4 1 代码和 ASP NET MVC 3 并且我正在努力正确设置自引用我有一个类别类它必须是自我引用的当表中ParentCategoryId为空时类别可以是父类别如果某个类别具有带值
直接从 Outlook 拖放到 Web 表单

我在网上搜索了一下大部分答案都是无法完成我的情况有点不同因为我们正在开发的应用程序仅用于内部目的并且可以允许浏览器中的任何安全级别它也是基于内部网的我还尝试查看是否有现成的 ActiveX 控件但无法找到一个允许直接从 Out
Sympy - 改变绘图的 y 轴范围

使用 Sympy 如何设置 y 轴的范围 plot x 2 2 我想让 y 轴从 0 到 7 当你绘图时你可以使用 kwargsxlim and ylim设置轴限制例如 gt gt gt plot x 2 2 xlim 3 3 ylim
使用 Delphi 在运行时创建 TWebBrowser

我有一个 TWebBrowser 对象它在运行时创建并在后台使用即不可见问题是像 OnDocumentComplete 这样的事件在 Delphi2009 中不起作用或不会被触发有什么建议吗 procedure TfrmMain F
将文件写入通用应用程序数据文件夹被拒绝

我使用以下函数将数据写入用户应用程序文件夹 private void WriteToLog string source string method string msg string LogFile Environment GetFolde
对一系列门票进行排序[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案这是问题陈述您有一叠包含出发地和目的地的车票您将获得出发城市和目的地城市你如何从堆栈中找到你的路线这是我的解决方
哪个更好的Javascript对象模式[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用“catch,when”捕获异常

我在 C 中发现了这个新功能它允许在满足特定条件时执行 catch 处理程序 int i 0 try throw new ArgumentNullException nameof i catch ArgumentNullException
在 python 函数中使用 *args、**kwargs 时“获得关键字参数的多个值”

传递命名参数时request通过 kwargs 我收到一个错误 Traceback most recent call last File testKwargs py line 9 in
Python re.findall

我试图检索包含名称字段的所有标签然后处理整个句子加上名称这是我的测试代码 sourceCode

Python re.findall

Python re.findall 的相关文章

随机推荐

热门标签