改进/修复 C 样式块注释的正则表达式

2024-05-01

我正在（用 C#）编写一个简单的解析器来处理看起来很像经典 C 的脚本语言。

在我拥有的一个脚本文件中，我用来识别 /* 块注释 */ 的正则表达式会进入某种无限循环，长时间占用 100% 的 CPU。

我使用的正则表达式是这样的：

/\*([^*]|[\r\n]|(\*+([^*/]|[\r\n])))*\*+/

关于为什么这可能被锁定有什么建议吗？

或者，我可以使用另一个正则表达式吗？

更多信息：

使用面向 .NET 3.5 的 C# 3.0 工作；
我使用 Regex.Match(string,int) 方法在字符串的特定索引处开始匹配；
我已经让程序运行了一个多小时，但比赛尚未完成；
传递给正则表达式构造函数的选项是RegexOptions.Multiline and RegexOptions.IgnorePatternWhitespace;
正则表达式适用于我的 453 个测试文件中的 452 个。

我发现你的正则表达式存在一些问题：

没有必要|[\r\n]正则表达式中的序列；否定的字符类，例如[^*]匹配所有内容，除了*，包括行分隔符。这只是.（点）与这些不匹配的元字符。

进入评论后，您唯一需要查找的字符就是星号；只要你没有看到其中一个，你就可以吞下任意数量的角色。这意味着使用没有意义[^*]当你可以使用[^*]+反而。事实上，你不妨把它放在一个原子组中——(?>[^*]+)——因为一旦你匹配了那些非星号，你就没有任何理由放弃它们。

过滤掉无关的垃圾，最外面的括号内的最终选择是\*+[^*/]，这意味着“一个或多个星号，后跟一个不是星号或斜线的字符”。这将始终与注释末尾的星号匹配，并且总是必须再次放弃它，因为下一个字符是斜杠。事实上，如果最后一个斜杠前有二十个星号，则正则表达式的该部分将与所有星号匹配，然后它将一一放弃所有星号。然后是最后一部分——\*+/-- 将永远匹配它们。

为了获得最大性能，我会使用这个正则表达式：

/\*(?>(?:(?>[^*]+)|\*(?!/))*)\*/

这将很快匹配一个格式良好的注释，但更重要的是，如果它开始匹配某些内容isn't一个有效的评论，它会尽快失败。

致谢David https://stackoverflow.com/questions/462843/improving-fixing-a-regex-for-c-style-block-comments/463339?noredirect=1#comment55996077_463339，这是一个将嵌套注释与任何嵌套级别相匹配的版本：

(?s)/\*(?>/\*(?<LEVEL>)|\*/(?<-LEVEL>)|(?!/\*|\*/).)+(?(LEVEL)(?!))\*/

它使用.NET 的平衡组，因此它不适用于任何其他风格。为了完整起见，这里有另一个版本（来自 RegexBuddy 的库），它使用 Perl、PCRE 和 Oniguruma/Onigmo 支持的递归组语法：

/\*(?>[^*/]+|\*[^/]|/[^*])*(?>(?R)(?>[^*/]+|\*[^/]|/[^*])*)*\*/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

改进/修复 C 样式块注释的正则表达式的相关文章

添加对共享类的多个 WCF 服务的服务引用

我正在尝试将我的 WCF Web 服务拆分为几个服务而不是一个巨大的服务但是 Visual Studio Silverlight 客户端复制了两个服务共享的公共类这是一个简单的例子来说明我的问题在此示例中有两个服务两者都返回类
如何进行带有偏差的浮点舍入（始终向上或向下舍入）？

我想以偏置舍入浮动要么总是向下要么总是向上代码中有一个特定的点我需要这个程序的其余部分应该像往常一样四舍五入到最接近的值例如我想四舍五入到最接近的 1 10 倍数最接近 7 10 的浮点数约为 0 69999998807 但
通信对象 System.ServiceModel.Channels.ServiceChannel 不能用于通信

通信对象System ServiceModel Channels ServiceChannel 无法用于通信因为它处于故障状态这个错误到底是什么意思我该如何解决它您收到此错误是因为您让服务器端发生 NET 异常并且您没有捕获并处理
调试内存不足异常

在修复我制作的小型 ASP NET C Web 应用程序的错误时我遇到了 OutOfMemoryException 没有关于在哪里查看的提示因为这是一个编译时错误如何诊断此异常我假设这正是内存分析发挥作用的地方有小费吗 Thank
在 C# 中将位从 ulong 复制到 long

所以看来 NET 性能计数器类型 http msdn microsoft com en us library system diagnostics performancecounter aspx有一个恼人的问题它暴露了long对于计数器
Xamarin Android：获取内存中的所有进程

有没有办法读取所有进程而不仅仅是正在运行的进程如果我对 Android 的理解正确的话一次只有一个进程在运行其他所有进程都被冻结后台进程被忽略您可以使用以下代码片段获取当前正在运行的所有 Android 应用程序进程 Activ
为什么 FTPWebRequest 或 WebRequest 通常不接受 /../ 路径？

我正在尝试从 ftp Web 服务器自动执行一些上传下载任务当我通过客户端甚至通过 Firefox 连接到服务器时为了访问我的目录我必须指定如下路径 ftp ftpserver com AB00000 incoming files
事件日志写入错误

很简单我想向事件日志写入一些内容 protected override void OnStop TODO Add code here to perform any tear down necessary to stop your serv
通过不同 DLL 或 EXE 中的指针或引用访问 STL 对象时发生访问冲突

我在使用旧版 VC6 时遇到以下问题我只是无法切换到现代编译器因为我正在处理遗留代码库 http support microsoft com kb 172396 http support microsoft com kb 172396
C# 创建数组的数组

我正在尝试创建一个将使用重复数据的数组数组如下所示 int list1 new int 4 1 2 3 4 int list2 new int 4 5 6 7 8 int list3 new int 4 1 3 2 1 int list4
如何从字符串中删除所有数字？

我想删除字符串 0 9 中的所有数字我写了这段有效的代码 words preg replace 0 words remove numbers words preg replace 1 words remove numbers words
通过等待任务或访问其 Exception 属性都没有观察到任务的异常

这些是我的任务我应该如何修改它们以防止出现此错误我检查了其他类似的线程但我正在使用等待并继续那么这个错误是怎么发生的呢通过等待任务或访问其 Exception 属性都没有观察到任务的异常结果未观察到的异常被终结器线程重新抛出
C# 搜索目录中包含字符串的所有文件，然后返回该字符串

使用用户在文本框中输入的内容我想搜索目录中的哪个文件包含该文本然后我想解析出信息但我似乎找不到该字符串或至少返回信息任何帮助将不胜感激我当前的代码 private void btnSearchSerial Click object
过期时自动重新填充缓存

我当前缓存方法调用的结果缓存代码遵循标准模式如果存在则使用缓存中的项目否则计算结果在返回之前将其缓存以供将来调用我想保护客户端代码免受缓存未命中的影响例如当项目过期时我正在考虑生成一个线程来等待缓存对象的生命周期然后运行
是否有一个 C++ 库可以从 PDF 文件中提取文本，例如 PDFBox for Java？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案去年我使用 PDFBox 在 Java 中创建了一个应用程序来获取某些 PDF 文件中的原始文本现在
为什么 Ajax.BeginForm 在 Chrome 中不起作用？

我正在使用 c NET MVC2 并尝试创建一个 ajax 表单来调用删除数据库记录 RemoveRelation 的方法删除记录的过程正在按预期进行删除记录后表单应调用一个 JavaScript 函数从视觉效果中删除该记录 Rem
Pure Bash 替换捕获组

我有这个示例字符串 test string 13A6 该字符数字可以是从 0 到 9 以及从 A 到 F 我想要这个输出 1 3 A 6 我有这个工作 result echo test string sed s g 我想在没有 sed 的
在基类集合上调用派生方法

我有一个名为 A 的抽象类以及实现 A 的其他类 B C D E 我的派生类持有不同类型的值我还有一个 A 对象的列表 abstract class A class B class A public int val get privat
WPF/数据集：如何通过 XAML 将相关表中的数据绑定到数据网格列中？

我正在使用 WPF DataSet 连接到 SQL Server Express XAML 和 C Visual Studio 2013 Express 我从名为 BankNoteBook 的现有 SQL Server Express 数据
如何创建向后兼容 Windows 7 的缩放和尺寸更改每显示器 DPI 感知应用程序？

我是 WPF 和 DPI 感知 API 的新手正在编写一个在 Windows 7 8 1 和 10 中运行的应用程序我使用具有不同每个显示器 DPI 设置的多个显示器并且有兴趣将我的应用程序制作为跨桌面配置尽可能兼容我已经知道可以将

随机推荐

从具有重复元素的向量生成所有独特的组合

这个问题之前曾被问过但仅适用于具有非重复元素的向量我无法找到一个简单的解决方案来从具有重复元素的向量中获取所有组合为了说明这一点我在下面列出了一个例子 x lt c red blue green red green red 向量 x
删除编译时的 LESS // 注释

是否可以配置LESS在通过JS编译时删除注释我想从输出的 less 文件中删除它们 Less的单行注释根据文档所述应该保持沉默单行注释在 LESS 中也有效但它们是沉默的它们不会出现在编译后的 CSS 输出中 Hi I m
AutoFixture，创建电子邮件地址列表

我正在编写一些单元测试并有一个名为Account其中有 public Guid AccountId get set public IEnumerable
jQuery：检查字段的值是否为 null（空）

这是检查字段值是否为的好方法null if person data document type value NULL 或者还有更好的方法字段的值不能为空它始终是字符串值该代码将检查字符串值是否为字符串 NULL 您想检查它是否是空字
将 showModalDialog() 的内容添加到剪贴板 Google 脚本

当我单击按钮时我已将格式化数据添加到模态对话框中我想要的内容showModalDialog 当我单击按钮时也会自动添加到剪贴板模态是用下面的代码生成的并且temp是我想要添加到剪贴板的输出 Output to Html var ht
在 C# 汇编版本中使用前导零是否合适？

我正在为我的 dot net dll 设置程序集版本汇编版本具有以下格式主要版本次要版本内部版本号修订版我将 Verison 设置如下 200 1 1 0 现在我的问题是我是否需要在次要版本内部版本号和修订号中保留前导零 20
覆盖菜单按钮标签文本颜色 (MacOS SwiftUI)

我可以覆盖菜单按钮标签的设置后变暗颜色吗下面的 GIF 显示了一个清晰明亮的菜单项在新选择后会变暗此系统样式的默认行为例如在触控板首选项中但它不符合可访问性标准例如 WCAG 要求活动控件中该字体大小的亮度对比度 gt 4
删除ID最小的记录

当我在 MySQL 中输入此查询时 DELETE FROM myTable WHERE ID SELECT Min ID FROM myTable 我收到以下错误消息 1093 You can t specify target table
枚举本质上不是 IEnumerable 的集合？

当您想要递归枚举一个分层对象根据某些条件选择一些元素时有许多技术示例例如扁平化然后使用 Linq 进行过滤就像在这里找到的那些链接文本 https stackoverflow com questions 141467 rec
Razor：为什么我的变量不在范围内

inherits umbraco MacroEngines DynamicNodeContext using System Collections List
如何测试视图是否用“login_required”装饰（Django）

我正在对用 login required 装饰的视图进行一些独立的单元测试例子 login required def my view request return HttpResponse test 是否可以测试 my view 函数
使用 Python 和 Boto3 列出 S3 存储桶的目录内容？

我正在尝试使用 Python 和 Boto3 列出 S3 存储桶中的所有目录我正在使用以下代码 s3 session resource s3 I already have a boto3 Session object bucket nam
重用 Jest 单元测试

我正在尝试使用 Jest 测试几个数据库实现为了帮助测试这些实现我首先针对两个实现都预期实现的 API 提出了一组单元测试我目前正在努力将这两个实现传递给测试套件下面是最简单形式的虚拟 MongoDB 实现 class Mongo
使用 Ant 运行 JUnit 测试

我正在尝试运行我的 JUnit 测试用例但我不断收到错误 Test com capscan accentsWorld FAILED 报告已创建但测试未运行这是我的蚂蚁代码
backbone.js - 如何在视图之间进行通信？

我有一个带有多个backbone js 视图的单页Web 应用程序观点有时必须相互沟通两个例子当有两种方式视图同时以不同方式呈现集合时并且对一个视图中的项目的点击必须转发到另一个视图当用户转换到流程的下一个阶段时第一个视图将数据
Java发送邮件出错

我的代码是 File Name SendEmail java import java util import javax mail import javax mail internet import javax activation pub
使用虚拟列表视图调用 BeginUpdate/EndUpdate 是否有用

我有一个虚拟列表视图其中有数百个项目我必须定期更新文件列表视图方法是清除它然后向其中添加新的更新的项目执行此操作时调用 BeingUpdate 和 EndUpdate 有用吗我没有注意到任何视觉差异 Thanks 使用可能有一
优化数组压缩

假设我有一个数组k 1 2 0 0 5 4 0 我可以按如下方式计算掩码m k gt 0 1 1 0 0 1 1 0 仅使用掩码 m 和以下操作左移右移 And Or 加减乘我可以将 k 压缩为以下形式 1 2 5 4 以下是我目
使用快速同步 h264_qsv 编码器时 ffmpeg avcodec_encode_video2 挂起

当我使用 mpeg4 或 h264 编码器时我能够使用 ffmpeg 3 1 0 的 API 成功编码图像以生成有效的 AVI 文件但是当我使用快速同步编码器 h264 qsv 时 avcodec encode video2 有时会挂
改进/修复 C 样式块注释的正则表达式

我正在用 C 编写一个简单的解析器来处理看起来很像经典 C 的脚本语言在我拥有的一个脚本文件中我用来识别块注释的正则表达式会进入某种无限循环长时间占用 100 的 CPU 我使用的正则表达式是这样的 r n r n 关于为什么这

改进/修复 C 样式块注释的正则表达式

改进/修复 C 样式块注释的正则表达式 的相关文章

随机推荐

热门标签

改进/修复 C 样式块注释的正则表达式的相关文章