(SKIP) 或 (F) 在正则表达式上如何工作？

2024-01-01

我正在学习正则表达式的高级用法，并注意到许多帖子使用(*SKIP) or (*F) in it.

我发布了一个问题，其想法是匹配没有的行yellow但有blue除非brown存在于蓝色之后。正确的答案是：

.*yellow.*(*SKIP)(*F)|^.*\bblue\b(?=.*brown).*$

我也尝试过如下所示的环视表达式，但并未适用于所有情况：

^((?!yellow).)*blue(?=.*brown).*$

我对这些一无所知(*SKIP)(*F)标志，所以问题是，这些标志是如何工作的？他们在做什么？还有其他类似的标志吗？

Thanks.

这两个回溯控制动词仅在 Perl、PCRE 和pypi正则表达式模块 https://pypi.python.org/pypi/regex.

的想法(*SKIP)(*FAIL)技巧是消耗您想要避免的字符，并且这些字符不能成为匹配结果的一部分。

使用此技巧的经典模式如下所示：

What_I_want_to_avoid(*SKIP)(*FAIL)|What_I_want_to_match

正则表达式引擎处理这样的字符串：

从左到右对每个字符测试模式的第一个标记（大多数时候默认情况下，但是一些正则表达式引擎可以设置为从右到左工作，如果我没记错的话.net可以做到这一点）
如果第一个标记匹配，则正则表达式引擎使用下一个字符测试模式的下一个标记（在第一个令牌匹配之后） etc.
当令牌失败时，正则表达式引擎会获取最后一个令牌匹配的字符，并尝试另一种方法来使模式成功（如果它也不起作用，正则表达式引擎会对之前的标记等执行相同的操作。）

当正则表达式引擎满足(*SKIP) verb （在这种情况下，所有之前的令牌显然都成功了），它不再有权返回到左侧的所有先前标记，也不再有权使用模式的另一个分支或在字符串中的下一个位置重试所有匹配的字符，直到最后一个匹配的字符（包括）如果该模式稍后在右侧失败(*SKIP) verb.

的作用(*FAIL)是迫使模式失败。因此左侧的所有字符都匹配(*SKIP)被跳过，正则表达式引擎在这些字符之后继续其工作。

在示例模式中，该模式成功的唯一可能性是第一个分支之前失败(*SKIP)允许测试第二个分支。

你可以找到另一种解释here https://stackoverflow.com/questions/19992984/verbs-that-act-after-backtracking-and-failure/20008790#20008790.

About Java ^{_{and other regex engines that don't have these two features}}

回溯控制动词未在其他正则表达式引擎中实现，并且没有等效项。

但是，您可以使用多种方法来完成相同的操作（更清楚地说，是为了避免可能与模式的其他部分匹配的内容）.

捕获组的使用：

way 1:

What_I_want_to_avoid|(What_I_want_to_match)

只需要提取捕获组1（或测试它是否存在），因为这就是您正在寻找的东西。如果使用模式进行替换，则可以使用匹配结果的属性（偏移量、长度、捕获组）来使用经典字符串函数进行替换。其他语言如 javascript、ruby...允许使用回调函数作为替代。

way 2:

((?>To_avoid|Other_things_that_can_be_before_what_i_want)*)(What_I_want)

这是更简单的替换方式，不需要回调函数，替换字符串只需要以\1 (or $1)

环顾四周的使用：

例如，您想要找到一个未嵌入其他两个单词之间的单词（比方说S_word and E_word是不同的（参见Qtax评论）):

（边缘情况S_word E_word word E_word and S_word word S_word E_word本例中允许。）

回溯控制动词方式将是：

S_word not_S_word_or_E_word E_word(*SKIP)(*F)|word

要使用这种方式，正则表达式引擎需要在一定程度上允许可变长度后视。使用.net或新的正则表达式模块，没有问题，lookbehinds可以具有完全可变的长度。 Java 也可以，但大小必须受到限制（例子：(?<=.{1,1000})).

Java 等效项将是：

word(?:(?!not_S_word_or_E_word E_word)|(?<!S_word not_E_word{0,1000} word))

请注意，在某些情况下，仅需要前瞻。还要注意，以文字字符开始模式比以后行开始更有效，这就是为什么我把它放在单词后面（即使我需要在断言中再次重写该词。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

(SKIP) 或 (F) 在正则表达式上如何工作？的相关文章

由表达式文字生成的正则表达式是否共享单个实例？

以下代码片段来自 Crockford 的Javascript 好的部分演示了由正则表达式文字创建的 RegExp 对象共享单个实例 function make a matcher return a gi var x make a mat
sed - 删除行尾的句点

我正在尝试删除文本文件中行尾的句点有些行末尾有句点有些则没有 cat textfile sometexthere 123 22 no period moretext with period lt remove this period n
正则表达式仅允许特定数字

我正在寻找一个只允许输入特定数字的正则表达式例如2 4 5 6 10 18 我尝试过类似的东西 2 4 5 6 10 18 我输入的任何内容都无法通过正则表达式然后计算机用手指着我并大笑我哪里出错了单引号是不必要的您正在寻找的正则
正则表达式匹配捕获组内的文本

示例文本 ruby object DynamicAttribute attributes resource id 1 resource type Applicant string value Michael int value id 359
使用Java获取CSS文件中图像的URL？

我正在尝试使用 Java 获取远程 CSS 文件中图像所有 MIME 类型的 URL 我正在使用 jsoup 来获取 css 的 URL 经过无数个小时的观看CSS解析器 http cssparser sourceforge net 由
正则表达式从 img 标签获取 src 值

我正在使用以下正则表达式来获取src第一个的值imgHTML 文档中的标签 string match src
正则表达式 - 剥离非数字并删除分（如果有）

我目前正在开发一个 PHP 项目需要一些正则表达式的帮助我希望能够获取用户输入的货币值并删除所有非数字和小数位分 Ex 2 000 00 到 2000 2 000 00 美元到 2000 2abc000 到 2000 2 000 到
Python正则表达式替换引号中的文本（引号本身除外）

例如我有一个测试字符串 content I opened my mouth Good morning I said cheerfully 我想使用正则表达式删除双语音标记之间的文本但不删除语音标记本身所以它会返回 I opened m
正则表达式提取大括号之间的文本

我正在尝试提取 PHP 中花括号之间的文本例如欢迎 user first name 使用 site 版本 1 5 您的用户名是 user username 您目前的声誉是 user reputation name 我用过在某些情况下
正则表达式提取美国邮政编码，但不提取假代码

使用 XML 包和 XPath 从网站上抓取地址有时我只能得到一个嵌入了我想要的邮政编码的字符串提取邮政编码很简单但有时会显示其他五位数字的字符串以下是 df 中问题的一些变体 zips lt data frame id seq 1
提取单花括号内的值

我想要一个收藏 value 一个字符串使用正则表达式例如 lorem ipsum field1 lorem ipsum field2 lorem ipsum field1 lorem ipsum field2 field3 我会得到 fi
用于计算句子中单词数的正则表达式

public static int getWordCount String sentence return sentence split a zA Z0 9 a zA Z0 9 1 length sentence replaceAll a
正则表达式 - 避免表达式中出现字符串

我正在尝试创建一个应该匹配以下情况的正则表达式如果单词完全匹配 first second third 那么匹配应该失败但如果它周围有任何字符那么应该匹配该字符串我还需要避免字符串中的某些字符集如果这些字符是字符串的一部分则匹配结
具有数组属性的 IFC 正则表达式

IFC 是用于建筑项目的 STEP 文件的变体 IFC 包含有关正在建造的建筑物的信息该文件基于文本易于阅读我正在尝试将这些信息解析为 python 字典每行的一般格式类似于以下内容第2334章 IFCMATERIALLAYERS
将字符串的第一个字母大写（前面带有特殊字符） - PHP

我想将字符串大写例如 hello 我希望我的函数返回 Hello 我尝试过使用 regex 和 preg match 但没有运气这是我之前的问题与此相关 preg match 正在匹配两个字符而它应该只匹配一个字符 https st
C#中如何从字符串中提取十进制数

string sentence X10 cats Y20 dogs 40 fish and 1 programmer string digits Regex Split sentence D 对于此代码我在数字数组中获取这些值 10 20
除了使用正则表达式之外，在 Swift 中解析 HTML

下面是我想在 Swift 中解析的 HTML 代码 td class pinyin a href rsc audio voice pinyin pz yi1 mp3 span class mpt1 y span a a href rsc a
我可以在 VIM 或 Perl 中替换单个正则表达式中的多个项目吗？

假设我有字符串 The Quick Brown Fox Jumps Over the Lazy Dog 我可以用一个正则表达式将其更改为 The Slow Brown Fox Jumps Over the Energy Dog 吗目前我
Java String ReplaceAll 方法给出非法重复错误？

我有一个字符串当我尝试运行时replaceAll方法我收到这个奇怪的错误 String str something op str str replaceAll o n it works fine str str replaceAll n
突出显示单词并提取其附近文本的函数

我有一个文本例如 Etiam porta semmalesuada magna mollis euismod 整数取数 ante venenatis dapibus posuere velit aliquet 埃蒂亚姆门塔塞姆 male

随机推荐

Azure 资源标识符格式 URI -URL 或 URN

我正在使用 Azure 我注意到它为每个资源组和资源创建了一个如下所示的 ID 对于资源组 subscriptions
R download.file 使用“wget”方法并指定额外的 wget 选项

我有一个关于使用的可能相当基本的问题download fileR 中的函数使用wget选项并使用一些 wget 额外选项但我就是无法让它工作我想做的下载一个网页的本地副本实际上是几个网页但目前的挑战是让它即使只有 1 个也能工作
导轨联系表不起作用

我正在尝试创建一个提交表单的联系人但我没有收到任何电子邮件在我的 config application rb 中我添加了 config action mailer raise delivery errors true config ac
AngularJS 向路由添加授权

如何向 AngularJS 和 ui router 添加授权我正在使用 modulg ng oauthhttps github com andreareginato oauth ng https github com andrearegi
Linq 查询具有分组依据

RowNum IMAGEID SCANEDATE COUNT 1 10000131 2012 07 04 00 00 00 000 1 2 10002626 2012 08 03 00 00 00 000 1 3 10003348 2012
React：ref 不是 prop

使用 React js 时为什么我得到 ref is not a prop key is not a prop error Notes 但是我在使用 webpack dev server 运行时没有遇到此错误我没有ref or key在
使用字符串作为函数参数

我确信这很简单但我找不到解决方案我想使用包含字符串的变量作为函数的参数 x lt c 1 10 myoptions lt trim 0 na rm FALSE 现在像 foo lt mean x myoptions 应该是一样的 fo
git 撤消受保护分支上的提交？

有没有办法撤消受保护分支上的提交我的意思是如果您推送了错误的提交在非受保护的分支上您可以将 HEAD 重置为最后一个所需的提交或者恢复错误的提交并强制推送从而撤消它但受保护的分支不允许强制推送对于这种情况有什么方法可以解决
如何确定寄存器是否从右到左加载，反之亦然

在查看 gdb 输出并查看汇编调用时通常我可以找到一个使用硬编码值的命令来确定寄存器是否从右到左加载反之亦然通常类似于以下内容 sub rsp 16 or sub 16 rsp 但其他时候没有像上面这样的值可见我所看到的都是类似以
Symfony 2 支持部分表单绑定吗？

我的问题 Symfony 2 支持吗PATCH请求或任何类型的partial表单内容提交如果是这样是否有正确或更准确地说首选方法来做到这一点除了PRE BIND 见下文事件方法还有其他模式或方法来解决这个问题吗如果有其
Haskell 函数返回存在类型

是否可以编写一个 Haskell 函数来生成隐藏了确切类型参数的参数化类型 IE 就像是f T gt exists a U a 明显的尝试 LANGUAGE ExistentialQuantification data D a D a da
在 Windows Phone 8 中保存 LongListSelector 控件的滚动位置

我需要保存 LongListSelector 位置以便在返回页面后恢复它首先我将 GetItemsInView 与 WP7 一起使用效果很好然后用 WP8 它就消失了我必须使用已实现项目 http msdn microsoft
有没有办法告诉 Dropbox 不要上传某个文件？（日食相关）

我正在尝试在两台计算机之间同步代码项目一台运行 Windows 另一台运行 Ubuntu 12 04 我在两台机器上都使用 Eclipse 但是元数据由于操作系统不兼容 Eclipse 生成的文件夹导致 Eclipse 崩溃我想知道是
说非确定性图灵机可以在多项式时间内解决 NP 问题会产生什么后果？

这些天我一直在研究NP问题计算复杂性和理论我相信我终于掌握了图灵机的概念但我有一些疑问我可以接受非确定性图灵机对于给定状态和正在读取的符号有几种选择并且它总是会选择最佳选项如维基百科所述 NTM 如何知道其中哪一个应该采
以高分辨率从网络摄像头捕获图片，同时使用 DirectShow.Net 以较低分辨率预览

我正在使用 DirectShow Net 将网络摄像头流式传输到我的 C 4 0 应用程序以读取 QR 码它每 0 5 秒拍摄一次快照看看是否可以找到任何 QR 码并对其进行解码这在我的开发计算机上在我可以使用网络摄像头的任何分辨率下
实现一键登录以与后端交互

我正在实施一键登录如所描述的here https developers google com identity one tap android idtoken auth一切基本上都很好我可以获得一个令牌在后端验证它等等但我有一个问题
如何保护 Laravel 模型属性

当使用其他框架或纯 PHP 时我会保护我的模型属性然后我根据需要创建公共 getter 和 setter 并使用它们代理 get and set 这有助于我晚上睡觉最近我开始使用 Laravel 我对 Eloquent 模型的不受
使用 Webpack 构建简单网站

我第一次尝试让 webpack 工作并且是在一个简单的网站上进行的但是无论我尝试什么它都无法正常工作我已经坚持了好几个星期了我认真地尝试了每一条线索但都无济于事我只需要一个对 webpack 没有问题的人来查看我的代码并提供有
使用 NumberFormat 将带有货币符号的数值转换回十进制

我想将以货币符号为前缀的可能的十进制值转换为仅数字值例如该值可以是以下任何一个 String s1 32 847 676 65 String s2 3 456 00 String s3 831 209 我希望转换后的结果是这样的 328
(*SKIP) 或 (*F) 在正则表达式上如何工作？

我正在学习正则表达式的高级用法并注意到许多帖子使用 SKIP or F in it 我发布了一个问题其想法是匹配没有的行yellow但有blue除非brown存在于蓝色之后正确的答案是 yellow SKIP F bblue b br

(*SKIP) 或 (*F) 在正则表达式上如何工作？

About Java and other regex engines that don't have these two features

(*SKIP) 或 (*F) 在正则表达式上如何工作？ 的相关文章

随机推荐

热门标签

(SKIP) 或 (F) 在正则表达式上如何工作？

About Java ^{_{and other regex engines that don't have these two features}}

(SKIP) 或 (F) 在正则表达式上如何工作？的相关文章