正则匹配规则

2023-11-16

规则1:优先选择最左端的匹配结果(Rule 1: The Match That Begins Earliest Wins)

    根据这条规则,起始位置最靠左的匹配结果总是优先于其他可能的匹配结果。这条规则并没有规定优先的匹配结果的长度(稍后将会讨论),而只是规定,在所有可能的匹配结果中,优先选择开始位置最左端的。实际上,因为可能有多个匹配结果的起始位置都在最左端,也许我们应该把这条规则中的“某个匹配结果(a match)”改为“该匹配结果(the match)”,不过这听起来有些别扭。

这条规则的由来是:匹配先从需要查找的字符串的起始位置尝试匹配。在这里,“尝试匹配(attempt)”的意思是,在当前位置测试整个正则表达式(可能很复杂)能匹配的每样文本。如果在当前位置测试了所有的可能之后不能找到匹配结果,就需要从字符串的第二个字符之前的位置开始重新尝试。在找到匹配结果以前必须在所有的位置重复此过程。只有在尝试过所有的起始位置(直到字符串的最后一个字符)都不能找到匹配结果的情况下,才会报告“匹配失败”。

所以,如果要用「ORA」来匹配FLORAL,从字符串左边开始第一轮尝试会失败(因为「ORA」不能匹配FLO),第二轮尝试也会失败(「ORA」同样不能匹配LOR),从第三个字符开始的尝试能够成功,所以引擎会停下来,报告匹配结果FLORAL。

如果不了解这条规则,有时候就不能理解匹配的结果。例如,用「cat」来匹配:
The dragging belly indicates that your cat is too fat.

结果是indicates,而不是后来出现的cat。单词cat是能够被匹配的,但indicates中的cat出现的更早,所以得到匹配的是它。对于egrep之类的程序来说,这种差别是无关紧要的,因为它只关心“是否”能够匹配,而不是“在哪里”匹配。但如果是进行其他的应用,例如查找和替换,这种差别就很重要了。

这里有一个小测验(应该不困难):如果用「fat|cat|belly|your」来匹配字符串‘The dragging belly indicates that your cat is too fat.’,结果是什么呢?请看下一页。

“传动装置(transmission)”和驱动过程(bump-along)

或许汽车变速箱(译注1)的例子有助于理解这条规则,驾驶员在换档时,变速箱负责连接引擎和动力系统。引擎是真正产生动力的地方(它驱动曲轴),而变速箱把动力传送到车轮。

传动装置的主要功能:驱动

如果引擎不能在字符串开始的位置找到匹配的结果,传动装置就会推动引擎,从字符串的下一个位置开始尝试,然后是下一个,再下一个,如此继续。不过,如果某个正则表达式是以“字符串起始位置锚点(start-of-string anchor)”开头的,传动装置就会知道,不需要更多的尝试,因为如果能够匹配,结果肯定是从字符串的头部开始的。在第6章中,我们会讲解这一点,以及更多的内部优化措施。

转自:http://book.51cto.com/art/200801/63853.htm

转载于:https://www.cnblogs.com/wen12128/archive/2012/11/22/2782742.html

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

正则匹配规则 的相关文章

随机推荐

  • ns修改服务器,修改你的域名ns服务器地址

    修改你的域名ns服务器地址 内容精选 换一换 域名的DNS服务器定义了域名用于解析的权威DNS服务器 通过华为云注册成功的域名默认使用华为云DNS进行解析 详细内容 请参见华为云DNS对用户提供域名服务的DNS是什么 若您选择非华为云DNS
  • Jupyter设置指定的python环境

    Jupyter设置指定的python环境 Jupyter在虚拟环境中启动 按理说在命令行执行如下命令 conda activate 环境名称 激活一个conda环境 再打开jupyter 输入如下命令 jupyter notebook 默认
  • mycat 分片规则-枚举分片-hash-int

    为方便测试 本实例在以下案例中测试https blog csdn net qq 41712271 article details 114984855 spm 1001 2014 3001 5501 通过在配置文件中配置可能的枚举值 指定数据
  • 5G MEC如何产生:从标准演进看云网融合

    01 概 述 5G MEC这个表述并不精确 两者相互成就 而非相互从属 说5G MEC 是因为随着5G的演进 MEC也在焕发新生 寻根溯源 与5G MEC相关的最重要的标准组织有三个 ITU International Telecommun
  • git 放弃本地修改,强制拉取更新

    原文链接 https blog csdn net haoaiqian article details 78284337 开发时 对于本地的项目中修改不做保存操作 或代码改崩 可以用到Git pull的强制覆盖 具体代码如下 git fetc
  • 转-各种排序动图

    1 快速排序 介绍 快速排序是由东尼 霍尔所发展的一种排序算法 在平均状况下 排序 n 个项目要 n log n 次比较 在最坏状况下则需要 n2 次比较 但这种状况并不常见 事实上 快速排序通常明显比其他 n log n 算法更快 因为它
  • 数据库设计与优化 - MySQL优化策略

    MySQL服务器操作层架构 MySQL语句的优化就发生MySQL Server服务器架构的操作层 这层具体的执行流程是 这层主要的功能是 SQL 语句的解析 优化 缓存的查询 MySQL 内置函数的实现 跨存储引擎功能 所谓跨存储引擎就是说
  • 如何防止uniswap/pancakeswap被机器人夹

    被机器人夹是通俗说法 实际就是 front running 抢先提前交易 具体就是机器人在链上侦测到你有买入行为的时候 他立刻买 gas给的比你高 快你一步确认 这样你成交价就高了 因为dex有滑点 所以你依旧会以高一点的价格成交并且再将价
  • 「PAT乙级真题解析」Basic Level 1002 (问题分析+完整步骤+伪代码描述+提交通过代码)

    乙级的题目训练主要用来熟悉编程语言的语法和形成良好的编码习惯和编码规范 从小白开始逐步掌握用编程解决问题 PAT乙级BasicLevelPractice 1002 问题分析 方案一 模拟 题目直接给定了步骤 用模拟法将给定步骤写成代码逻辑是
  • C++primer十五章笔记15.7构造函数与拷贝控制

    15 7构造函数与拷贝控制 位于继承体系中的类也需要控制当其对象执行一系列操作时发生什么样的行为 创建 拷贝 移动 赋值和销毁 如果一个类没有定义拷贝控制操作 则编译器会给出一个合成的版本 可以被定义为被删除的函数 15 7 1虚析构函数
  • webrtc scoped_refptr、C++智能指针(防忘记录)

    C 智能指针有三种 shared ptr unique ptr weak ptr 具体说明参见 防忘链接 https www cnblogs com wxquare p 4759020 html webrtc的scoped refptr类似
  • maven下载不到源码:Cannot download sources Sources not found for:

    记录下记录下 很神奇的问题 也不去深究了 解决就行 侧重点不在这 就把方法记录下了 文章目录 问题 问题排查 方案一 Maven的镜像换一换试一试 方案二 删掉工程下的缓存和IDE配置文件 方案三 找个能下载源码的同事或环境换上它的mave
  • 图神经网络入门推荐好文(附GNN大佬资料包下载福利)

    今天想和大家分享的是图卷积神经网络 随着人工智能发展 很多人都听说过机器学习 深度学习 卷积神经网络这些概念 但图卷积神经网络 却不多人提起 那什么是图卷积神经网络呢 简单的来说就是其研究的对象是图数据 Graph 研究的模型是卷积神经网络
  • 信息收集-服务器信息

    服务器上面可以运行大量的系统服务和第三方应用服务 如果操作系统或者第三方软件没有及时升级打补丁 攻击者就有可能直接通过服务器上运行的服务进行攻击 服务器需要收集的信息包含三个方面 操作系统信息等识别 waf Web应用程序防火墙 CMS 内
  • 有没有哪个瞬间,让你突然对ChatGPT感到失望?

    不知道你是否和我一样 在第一次使用ChatGPT输入Prompt 并得到答复的那一刻 都会忍不住地赞叹一句 握草 但随着时间慢慢拉长 体验不断深入 想法也会慢慢改变 主题图 by Midjourney Prompt The moment o
  • [内核内存] slab分配器1---slab机制详解

    文章目录 1 slab分配器原理 2 slab分配器重要数据结构以及组织关系 2 1 slab cache描述符struct kmem cache 2 2 slab描述符struct page 3 slab分配器中各个重要结构体间的关系总结
  • 零基础自学计算机方法大全

    欢迎入读 尚学堂给同学们带来全新的Java300集课程啦 java零基础小白自学Java必备优质教程 学习从来没有捷径 只有学成之后才会一切是那么简单 想要学会编程 一定要有坚定的信念 1 选方向 定目标 首先你需要做好功课 了解计算机的分
  • paxos之Multi-Paxos

    paxos之Multi Paxos 一 基本原理介绍 朴素Paxos算法的Latency很高 Multi Paxos通过改变Promised的生效范围至全局的Instance 收到来自其他节点的Accept 则进行一段时间的拒绝提交请求 从
  • Git使用方法 与 gitee实战 & sourcetree

    参考 Git教程 廖雪峰的官方网站 版本控制工具 git 1 版本控制 记录一个或者多个文件内容变化 以便于未来查询指定的版本信息 svn 集中式 git 分布式 防止代码的丢失 团队协作 版本还原 更好的管理代码 2 git介绍 用于代码
  • 正则匹配规则

    规则1 优先选择最左端的匹配结果 Rule 1 The Match That Begins Earliest Wins 根据这条规则 起始位置最靠左的匹配结果总是优先于其他可能的匹配结果 这条规则并没有规定优先的匹配结果的长度 稍后将会讨论