使用 Perl 正则表达式捕获 C 样式代码块之前和之后的文本

2024-02-18

我正在尝试使用 Perl 正则表达式捕获 C 样式代码块之前和之后的一些文本。到目前为止，这就是我所拥有的：

use strict;
use warnings;

my $text = << "END";
int max(int x, int y)
{
    if (x > y)
    {
        return x;
    }
    else
    {
        return y;
    }
}
// more stuff to capture
END

# Regex to match a code block
my $code_block = qr/(?&block)
(?(DEFINE)
    (?<block>
        \{                # Match opening brace
            (?:           # Start non-capturing group
                [^{}]++   #     Match non-brace characters without backtracking
                |         #     or
                (?&block) #     Recursively match the last captured group
            )*            # Match 0 or more times
        \}                # Match closing brace
    )
)/x;

# $2 ends up undefined after the match
if ($text =~ m/(.+?)$code_block(.+)/s){
    print $1;
    print $2;
}

我遇到了第二个捕获组在比赛后未初始化的问题。有没有办法在 a 之后继续正则表达式DEFINE堵塞？我认为这应该可以正常工作。

$2应该包含代码块下方的注释，但它没有，而且我找不到这不起作用的充分理由。

捕获组按照它们在正则表达式中出现的顺序从左到右编号，而不是按照它们匹配的顺序。这是正则表达式的简化视图：

m/
  (.+?)  # group 1
  (?:  # the $code_block regex
    (?&block)
    (?(DEFINE)
      (?<block> ... )  # group 2
    )
  )
  (.+)  # group 3
/xs

命名组也可以作为编号组进行访问。

第二组是block团体。但是，该组仅用作命名子模式，而不用作捕获。因此，$2捕获值是undef。

因此，代码块之后的文本将存储在 capture 中$3.

有两种方法可以处理这个问题：

对于复杂的正则表达式，仅使用命名捕获。一旦您从正则表达式对象组装正则表达式，或者如果捕获是有条件的，则认为正则表达式很复杂。这里：
```
if ($text =~ m/(?<before>.+?)$code_block(?<afterwards>.+)/s){
    print $+{before};
    print $+{afterwards};
}
```
将所有定义放在最后，这样它们就不会弄乱您的捕获编号。例如，您的$code_blockregex 只会定义一个命名模式，然后您可以显式调用该模式。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

perl

regexrecursion

使用 Perl 正则表达式捕获 C 样式代码块之前和之后的文本的相关文章

PCRE PHP “S”（模式的额外分析）修饰符的用法和实用性的具体示例？

PHP 手册对 PCRE 的 S 模式的额外分析修饰符进行了以下说明http php net manual en reference pcre pattern modifiers php http php net manual en re
正则表达式括号之间的匹配 (...)

我正在尝试从一条简单的线中抓取 2 件物品 Title Description 编辑实际上一个想要显示的网址称为描述因为我希望它显示而不是实际解析 Trivium https www youtube com user trivium 在
是否可以使用perl读取pdf文件中的文本？

我想在 perl 中解析 pdf 文件中的文本而不将 pdf 转换为任何其他格式是否可以是的你可以看看CAM PDF http search cpan org dist CAM PDF 包裹您可以使用此模块来提取文本 my pdf
如何确定输入的模式是“Int，VarChar，Date，Time ...”等

我有一个下拉菜单其中包含DataType 和一个文本框这是用于输入的Regex Pattern 如果我进入 test 在文本框中或从下拉菜单中选择Int 如果在文本框中输入则其模式是错误的 0 9 那么它的correct patte
使用 javascript 在字符串中查找电子邮件地址

我想做的是从字符串中提取电子邮件地址SomeName First email protected cdn cgi l email protection 这是我已经尝试过的代码 var stringToSearchIn SomeName Fi
我需要一个便携式、一致的伪随机数生成器

I am writing a kid sister encryption http enfranchisedmind com blog posts the kid sister crypto manifesto function and I
正则表达式中的 \z 和 \Z 之间有什么区别以及何时以及如何使用它？

From http java sun com j2se 1 5 0 docs api java util regex Pattern html http java sun com j2se 1 5 0 docs api java util
JavaScript RegEx 到 CamelCase 连字符的 CSS 属性

我正在尝试更改 CSS 属性如下所示 moz border radius 像这样的 JavaScript CSS 属性 MozBorderRadius 我正在使用这个正则表达式 var exp new RegExp a z gi cons
当一个模块安装了两个版本时 Perl 会做什么？

我在正在使用的远程机器上没有 root 访问权限因此我使用 cpanm 和 local lib 的组合如下所述here https stackoverflow com a 2980715 1156644将 CPAN 模块安装到我的本地目
正则表达式匹配非整数？

尝试创建一个忽略正确整数的正则表达式 1 5 999等和正斜杠但在其他所有内容中都找到匹配项例如它将找到以下匹配项 test test1 test 1 但忽略了 1 55 7 这是为了模组重写 0 9 我想应该可以解决这个问题它将
JavaScript 中最大长度的正则表达式

如何限制与正则表达式匹配的字符串的长度我假设var sixCharsRegEx 6 7 只匹配长度为 6 或 7 的字符串 but no http jsfiddle net FEXbB http jsfiddle net FEXbB 我缺
如何删除空 html 标签（其中包含空格和/或其 html 代码）

需要 preg replace 的正则表达式这个问题没有在另一个问题中得到回答因为并非我要删除的所有标签都不为空我不仅要从 HTML 结构中删除空标签还要删除包含换行符以及空格和或其 html 代码的标签可能的代码是删除匹
regex php - 查找 div 中具有特定 ID 的内容

我确信这是一个简单的问题尽管我在谷歌上进行了如此多的搜索和搜索但我似乎无法弄清楚这有什么问题我在此页面上的其他区域使用类似的表达式来准确返回我想要的内容但是我无法让这个特定的位返回我想要的东西所以也许有人可以帮助我我有一个带有
哪一个代表null？ undef 或空字符串

我想插入null在表的一列中哪一个代表null undef或空字符串应该使用哪一种为什么我知道关于defined我可以检查一下但我更多的是从数据库的角度来看代表哪一个null更合适吗 Update 我在用DBI module D
如何在 Eclipse 中使用正则表达式将大写字母替换为小写字母？

我想检查所有源代码文件并替换所有出现的k Xyyy with k xyyy 交换后面的第一个字母k 从大写到小写我正在使用 Eclipse 对话框来搜索和替换多个文件现在我有正则表达式 bk A Z 如何指定正则表达式的替换字符串我刚
在 JavaScript 中从字符串的开头到结尾删除 HTML 内容组

我需要一个可以从头到尾删除完整标签的正则表达式例如对于给定的字符串 var str Hello World 我需要一个输出 Hello World with full script tag including inner content
使用点匹配全部模式的正则表达式

通常情况下不匹配换行符除非我指定引擎使用 s 旗帜我使用 Perl 样式正则表达式模式在编辑器 UltraEdit v14 10 正则表达式引擎上尝试了此正则表达式 s i 搜索文本包含多行每行包含许多 i 字符我期望上面的正则表
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
如何使用 Perl 从 NCBI 获取 FASTA 核苷酸格式的基因特征？

我可以手动下载 FASTA 文件如下所示 gt lcl CR543861 1 gene 1 ATGCTTTGGACA gt lcl CR543861 1 gene 2 GTGCGACTAAAA 通过单击发送到并选择基因特征 FAST
从 Python 中编译的正则表达式中提取命名组正则表达式模式

我有一个 Python 正则表达式其中包含多个命名组但是如果先前的组已匹配则可能会错过与一组匹配的模式因为似乎不允许重叠举个例子 import re myText sgasgAAAaoasgosaegnsBBBausgisego

随机推荐

IntelliJ 无法将爆炸战争部署到 tomcat

我有一个 Java Web 应用程序正在 IntelliJ 中开发并使用 Apache Tomcat 进行部署我定义了一些在团队中的每个人之间共享的运行配置这些运行配置被定义为将分解的战争工件部署到本地 tomcat 中其他团队成员
如何从检测意图 API 触发对话流事件？

如何从 python 检测意图 API 触发对话流中的事件我想在启动聊天窗口时立即触发欢迎意图您需要将 WELCOME 事件作为查询输入的一部分发送到调用detect intent 它可能看起来像这样 import dialogflow
在应用程序购买沙箱中不提示我输入登录/密码

我们正在开发一款应用程序当然用于应用程序购买 IAP 我已完成指南中启用 iap 的所有操作一切正常直到我想购买一些代码 MainViewController m void viewDidLoad if SKPaymentQueu
将 JTable 放入 JTree 中

与螺纹有关Jtable 作为 Jtree 节点 https stackoverflow com questions 8839025 jtable as a jtree node我把 JTable 放到 JTree 中但是JTree视图在启
无法解析缺少分钟的日期？

我正在尝试解析不包含分钟 2019 10 12T07Z 的日期时间字符串 import java time OffsetDateTime import java time format DateTimeFormatter public cl
从触发器下载delphi中的文件并捕获文件名

我有一个网站的网址它看起来像这样 http www example com downloads file 4789 download http www example com downloads file 4789 download 我想
shouldOverrideUrlLoading 仅在某些网页上被调用

我正在为针对多个客户端进行个性化的应用程序使用 shouldOverrideUrlLoading 方法每个客户端都有自己的网页想要加载到 webview 中我的问题是这样的该应用程序非常适合客户 A 及其网页但不适用于客户 B 的网
django-admin startproject尝试创建manage.py两次？

我正在努力解决Django 教程 https docs djangoproject com en 1 9 intro tutorial01 版本 1 9 在 Ubuntu 15 10 上运行当我到达跑步的台阶时django admin s
Express.js 无法 GET /index.html.var

所以我在共享主机 FastComet 中运行一个快速应用程序但如果我想访问我会收到此消息无法获取 index html var 显然这与 htaccess file 我解决这个问题的方法是添加 DirectoryIndex disab
删除 iOS 7 中的 Tab Bar 水平分隔符

我想删除 UITabBar 和屏幕其余部分之间的水平分隔线我问和这个人有同样的问题 https stackoverflow com q 11104796 1224741但针对 iOS7 进行了更新设置我的 UITabBar 的背景图像并
使用mockito库模拟java中的final类[重复]

这个问题在这里已经有答案了我有一个最终类它有一个我想执行特定操作的方法因此我想创建最终类的对象但我无法创建它以下是我的课程 public final class A private String name A String nam
在 Emacs 中搜索标记（选定）文本

我使用 emacs 查看和编辑代码和其他文本文件我想知道是否有一种方法可以向前或向后搜索当前缓冲区中标记的文本类似于我在记事本或写字板中可以执行的操作就像我可以在缓冲区中标记一些文本并执行 C s 或 C r 并能够使用标记的文本进行
无法在画布上绘制垂直虚线

我正在使用以下 javascript 算法在画布上绘制虚线该算法正确绘制水平线但无法绘制垂直线 g dashedLine function x y x2 y2 dashArray this beginPath this lineWidt
javascript 上的 localStorage 带来刷新

我试图在空闲时关闭用户在选项卡之间使用 javascript 下面的代码对于单个选项卡工作正常对于多个选项卡它无法正常工作例如我设置了 10 秒作为空闲时间并离开了第一个选项卡它会在 10 秒内将用户抛出假设我在以下位置打开了
使用 babel 6 时，` __webpack_require__(...) 不是一个函数`

一切似乎都建立得很好 http d pr i 1aZxR http d pr i 1aZxR使用以下配置但是当我运行代码时出现以下错误通过 webpack dev server Uncaught TypeError webpack
如何在 R 中对行和列进行子集化

我是R新手在阅读 R in action 这本书时遇到了一个问题代码有什么区别newdata lt leadership order leadership age and newdata lt leadership order lea
协变和逆变之间的区别

我无法理解协变和逆变之间的区别问题是协变和逆变有什么区别协变和逆变是将集合中的一个成员与另一个成员关联起来的映射函数更具体地说映射可以是协变的或逆变的relation在那一套上考虑所有 C 类型集的以下两个子集第一的 Anim
存储目录结构的数据结构？

我正在使用 struts 2 框架开发一个简单的 java web 应用程序该应用程序的目的是使用JSP页面显示我的计算机下的特定目录结构我的问题是使用哪种数据结构为了存储目录结构以便 JSP 页面可以从操作类访问该目录结构对象 ps
我应该从 Python 3.0 开始吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案最近我决定扩大我的编程视野并学习Python编程语言虽然我在大学课程和工作中的一两个项目中使用过一点 Python 但我绝不是专家我的问题如
使用 Perl 正则表达式捕获 C 样式代码块之前和之后的文本

我正在尝试使用 Perl 正则表达式捕获 C 样式代码块之前和之后的一些文本到目前为止这就是我所拥有的 use strict use warnings my text lt lt END int max int x int y if x

使用 Perl 正则表达式捕获 C 样式代码块之前和之后的文本

使用 Perl 正则表达式捕获 C 样式代码块之前和之后的文本 的相关文章

随机推荐

热门标签

使用 Perl 正则表达式捕获 C 样式代码块之前和之后的文本的相关文章