使用正则表达式解析 C 风格注释，避免回溯

2024-04-10

我想匹配 JavaScript 文件中的所有块注释和多行注释（这些是 C 风格注释）。我有一个效果很好的模式。然而，它会产生一些回溯，从而显着减慢速度，尤其是在较大的文件上。

图案：\/\*(?:.|[\r\n])*?\*\/|(?:\/\/.*)

例子：https://www.regex101.com/r/pR6eH6/2 https://www.regex101.com/r/pR6eH6/2

怎样才能避免走回头路呢？

由于交替，你会出现严重的回溯。而不是(?:.|[\r\n])，您可以考虑使用字符类[\s\S]显着提高性能：

\/\*[\s\S]*?\*\/|\/\/.*

See demo https://www.regex101.com/r/bY3sJ9/1

在 Python 中，您可以使用re.S/re.DOTALL修改器使.也匹配换行符（请注意，单行注释模式应与\/\/[^\r\n]* then):

/\*.*?\*/|//[^\r\n]*

See 另一个演示 https://www.regex101.com/r/pX0fC6/2

However, since *? 惰性量词也会导致类似于贪婪量词引起的开销，您应该考虑使用更优化的模式C风格多行注释 https://stackoverflow.com/questions/13014947/regex-to-match-a-c-style-multiline-comment/36328890#36328890 - /\*[^*]*\*+(?:[^/*][^*]*\*+)*/，整个正则表达式现在看起来像：

/\*[^*]*\*+(?:[^/*][^*]*\*+)*/|//.*

See 另一个演示 https://www.regex101.com/r/pX0fC6/2

Details:

/\* - a /*
[^*]*- 零个或多个字符以外的字符*
\*+- 一个或多个星号
(?:[^/*][^*]*\*+)* - zero or more sequences of:
- [^/*]- 符号以外的符号/ and *
- [^*]*- 零个或多个符号以外的符号*
- \*+- 1+ 星号
/ - a / symbol
| - or
//.* - //以及除换行符之外的任何 0+ 字符。

只是想注意，在Python中，你不需要转义/（在JS中，你不需要转义/使用 RegExp 构造函数声明正则表达式时）。

NOTE：最后一个模式不允许简单地捕获里面的内容/* and */，但由于该模式比其他模式更稳定，因此即使您需要捕获带有尾随的内容，我也建议使用它* - /\*([^*]*\*+(?:[^/*][^*]*\*+)*)/|//(.*)- 然后你需要删除最后一个字符.group(1).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用正则表达式解析 C 风格注释，避免回溯的相关文章

.pyx 文件出现未知文件类型错误

我正在尝试构建一个包含 pyx 文件的 Python 包 pyregion 但在构建过程中出现错误检查以下输出 python setup py build running build running build py creating b
jQuery 选择器：为什么 $("#id").find("p") 比 $("#id p") 更快

该页面的作者 http 24ways org 2011 your jquery now with less suck http 24ways org 2011 your jquery now with less suck断言 jQuery
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
如何清除WebGL中的矩形区域？

WebGL 有一个clear清除整个表面的方法清除表面的特定矩形的最佳方法是什么例如我想将一个从 50 50 开始的 100x100 像素框设置为全零 ARGB 0 0 0 0 我现在能想到的就是用一个写入零的片段着色器绘制一个四边形
使用 Keras np_utils.to_categorical 的问题

我正在尝试将整数的 one hot 向量数组制作为 keras 将能够使用的 one hot 向量数组来拟合我的模型这是代码的相关部分 Y train np hstack np asarray dataframe output vecto
React无限滚动scrollableTarget动态获取id？

我在我的项目中使用react infinite scroll component 如何让scrollableTarget动态获取item id 我试过这样scrollableTarget item id 但它不起作用必须与该 div 具有
是否可以使用打字稿映射类型来创建接口的非函数属性类型？

所以我正在研究 Typescript 的映射类型是否可以创建一个接口来包装另一种类型从而从原始类型中删除函数例如 interface Person name string age number speak void type Data
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
Jquery，清除/清空 tbody 元素的所有内容？

我认为这会相当简单但似乎空方法无法清除我拥有的 tbody 如果有人知道执行此操作的正确方法我将不胜感激我只想删除 tbody 中包含的所有内容到目前为止我正在尝试 tbodyid empty HTML table tbody tr
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
从多维无穷大数组中删除数组元素

我想删除一个特定元素例如我想删除元素id 76在下面的数组中而且数组可以无限地组合在一起这里的问题是我无法刷新页面因为我使用 Vue js 进行即时操作如果我能做到这一点我的下一个问题可能是如何在我现在想要的地方添加一个元素
加载另一个 JS 脚本后加载

这是我的代码 very big js file lots of html stuff 问题是这些是异步加载的有没有办法等待第二个脚本直到第一个脚本加载如果您使用 jQuery 有一个非常简单的方法可以通过获取脚本 https api
需要js、d3 和 nvd3 集成

我面临整合的问题要求 questions tagged requirejs with d3 questions tagged d3 and nvd3 questions tagged nvd3 我找到了一个使用 require 的简单解决方
Python SSL X509：KEY_VALUES_MISMATCH

Python HTTPS server from http server import HTTPServer SimpleHTTPRequestHandler import ssl https stackoverflow com a 408
当找到匹配时使用 sed 替换行首

我有一个 Java 文件我想注释包含匹配的任何代码行 myvar 我认为 sed 应该在这里帮助我 sed s myVar not sure what to put here g MyFile java 我不知道要输入什么 not sur
双击打开 ipython 笔记本

相关文章通过双击 osx 打开 ipython 笔记本 https stackoverflow com questions 16158893 open an ipython notebook via double click on osx
如何在 SVG 元素上使用箭头标记？

我需要在 d3 js 中创建一个箭头但我找到的只是带有节点图的示例我需要的是简单地制作一个从 A 点到 B 点的箭头我尝试实现以下示例中的部分代码 http bl ocks org 1153292 http bl ocks org 1
我可以使用 jQuery 动态创建文件（及其内容）吗？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 这是我的 HTML 代码 ul li

随机推荐

按 iframe 内的 Youtube 订阅表单按钮

我正在搜索如何从 Youtube 订阅表单按下订阅按钮但我没有找到任何可以帮助我的东西我是 JS 新手所以我希望你能帮助我用于按下订阅按钮here http www youtube com subscribe widget p aa
如何在 JavaScript 中模拟 target="_blank"

当用户单击链接时我需要更新数据库中的字段然后在新窗口中打开请求的链接更新没问题但我不知道如何打开新窗口而不要求他们单击另一个超链接 a href http www mydomain com ReportID 1 target bla
如何在 ASP.NET MVC 3 Intranet 应用程序中重新验证用户身份？

该应用程序已经使用 Windows 集成安全性而不是 Forms 我想要完成的是所谓的逐步身份验证或针对以下情况的强制重新身份验证用户正在浏览网站做一些常见的琐碎的事情突然用户必须执行敏感操作例如授权资源分配或确认汽车
iPhone开发与越狱

我是 iPhone 开发新手我们可以通过以下方式开发iphone应用程序 legal 越狱如果我越狱了我的iPhone操作系统之后我可以安装最新版本的iPhone操作系统吗并从苹果网站再次使其合法如果我开发越狱应用程序我可以将其
.NET MVC：调用 RedirectToAction 传递模型？

我有一个观点List aspx与班级绑定的Kindergarten 在控制器中 public ActionResult List int Id Kindergarten k from k1 in kindergartensRepositor
Android - 包括 GitHub 库 ActionBar PullToRefresh

我在包含来自 GitHub 的库时遇到问题这是图书馆 https github com chrisbanes ActionBar PullToRefresh https github com chrisbanes ActionBar Pu
我正在尝试通过外部 api 从 json 数据获取键值对，并使用 Angular 和 TypeScript 显示它。我怎样才能实现这个目标？

我想从我的 api 获取结果对象中的每个键值对以显示在我的前端上即类别类型难度问题正确答案我已正确设置服务和组件我需要做的就是获取 json 并显示每一对该方法名称称为 fetchQuestions 如下所示我只需简单地以
是否可以一次性增加 YouTube api 的配额？

我正尝试将大约 4 000 个视频添加到 YouTube 播放列表中使用基于成本的配额系统我每天只能添加大约 200 个这意味着我需要大约三周的时间来完成这个项目此外我需要添加的视频列表将继续增长直到我最终确定播放列表因为它在
CF10-jpg的文件格式

在开发一个允许交换多个第三方应用程序的图像并从而为这些应用程序创建单独的皮肤的工具时我偶然发现了一种 jpg 格式我似乎无法找到任何合适的信息当在十六进制编辑器中查看它时它以标签 CF10 开头搜索互联网只提供了一个能够处理此
如何在 WAI 服务器中执行关闭命令？

我想为我的 web 应用程序实现一个正常关闭命令与我的第一直觉相反即只是要求人们终止该进程我的前两次尝试包括 liftIO exitSuccess E yield responseLBS statusOK G contentTyp
颜色生成功能

让我们考虑以下场景一个可以生成从白色到红色从白色到蓝色从白色到粉色从白色到橙色等代码颜色的函数颜色代码采用 RGB 格式值从 0 到 255 有任何想法吗您能给我伪代码或此类算法的链接吗听起来你在追求线性插值 http en
MySQL 行格式：固定和动态之间的区别？

MySQL 根据列数据类型将表的行格式指定为固定或动态如果表具有可变长度列数据类型例如 TEXT 或 VARCHAR 则行格式是动态的否则它是固定的我的问题是两种行格式有什么区别其中一个比另一个更有效率吗这种差异实际上只对
如何将我的 WordPress 帖子分享到 Instagram [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案有谁知道如何使用Instagram API将我的 WordPress 网站上的照片分享到我的 Instagram 帐户根据Insta
Azure 数据工厂检查复制记录的行数

我正在设计一个 ADF 管道用于将 SQL 表中的行复制到 Azure Data Lake 中的文件夹之后 SQL 中的行应该被删除但是对于发生的删除操作我想知道复制的行数是否与我在管道开头选择的行数相同有没有办法获取复制操作的行
具有多个 Oracle 客户端版本的 cx_Oracle

我正在运行 Python 2 7 并在 Linux 64 位操作系统上使用 cx Oracle 我需要能够针对 11 2 或 12 1 Oracle 客户端运行因为我无法确定哪个客户端将安装在部署的目标上我知道有针对每个 Oracle
OSX 上的单调时钟

CLOCK MONOTONIC似乎不可用所以clock gettime已经出局了我在一些地方读到 mach absolute time 可能是正确的方法但在读到它是一个 cpu 相关值后它立即让我想知道它是否在下面使用 rtdsc
JPA Criteria api 通过嵌入式 ID 加入

我有以下实体 Entity Table name place revision public class PoiRevision OneToMany mappedBy pk revision cascade CascadeType ALL
Django - 多个用户配置文件

最初我的 UserProfile 是这样开始的 from django db import models from django contrib auth models import User class UserProfile mode
在 X-Editable 中通过 Ajax 提交数据

我正在尝试使用 Ajax 提交数据X 可编辑 https vitalets github io x editable docs html并且在运行 url 参数中定义的 php 脚本时遇到问题实际上我从工作中得到了基本的例子 Html
使用正则表达式解析 C 风格注释，避免回溯

我想匹配 JavaScript 文件中的所有块注释和多行注释这些是 C 风格注释我有一个效果很好的模式然而它会产生一些回溯从而显着减慢速度尤其是在较大的文件上图案 r n 例子 https www regex101 com r

使用正则表达式解析 C 风格注释，避免回溯

使用正则表达式解析 C 风格注释，避免回溯 的相关文章

随机推荐

热门标签

使用正则表达式解析 C 风格注释，避免回溯的相关文章