如何修复 BBcode 正则表达式

2024-03-22

我有一个获取 BBcode 标签的正则表达式。除了一个小故障之外，它工作得很好。

这是当前的表达式：

\[([^=\[\]]+)[=\x22']*([^ \[\]]*)['\x22]*\](.+)\[/\1\]

以下是它成功匹配的一些文本及其构建的组：

[url=http://www.google.com]去 http://www.google.com%5DGo去谷歌！[/url]
1：网址
2: http://www.google.com http://www.google.com
3：去谷歌！

[img]http://www.somesite.com/someimage.jpg[/img] http://www.somesite.com/someimage.jpg%5B/img%5D
1：图像
2：空
3: http://www.somesite.com/someimage.jpg http://www.somesite.com/someimage.jpg

[quote][quote]第一个嵌套引用[/quote][quote]第二个嵌套引用[/quote][/quote]
1：报价
2：空
3: [quote]第一个嵌套引用[/quote][quote]第二个嵌套引用[/quote]

所有这一切都很棒。我可以通过针对相同的正则表达式运行第三个匹配组来处理嵌套标签，并递归地处理所有嵌套的标签。问题在于使用 [quote] 标签的示例。请注意，第三个匹配组是一组两个引号标记，因此我们期望有两个匹配。然而，我们得到了一场比赛，如下所示：

[quote]第一个嵌套引用[/quote][quote]第二个嵌套引用[/quote]
1：报价
2：空
3: 第一个嵌套引用[/quote][quote]第二个嵌套引用

啊啊啊！这根本不是我们想要的。有一个相当简单的方法来修复它，我修改了正则表达式：

\[([^=\[\]]+)[=\x22']*([^ \[\]]*)['\x22]*\](.+)\[/\1\]

To this:

\[([^=\[\]]+)[=\x22']*([^ \[\]]*)['\x22]*\](((?!\[/\1\]).)+)\[/\1\]

通过增加((?!\[/\1\]).)如果第三个匹配组包含结束 BBcode 标记，我们将使整个匹配无效。现在可以了，我们得到两个匹配项：

[quote]第一个嵌套引用[/quote][quote]第二个嵌套引用[/quote]

[quote]第一个嵌套引号[/quote]
1：报价
2：空
3：第一个嵌套引用

[quote]第二个嵌套引号[/quote]
1：报价
2：空 3：第二个嵌套引用

我很高兴解决了这个问题，但现在我们遇到了另一个问题。这个新的正则表达式在第一个正则表达式中失败，我们将两个引号标签嵌套在一个更大的引号标签下。我们得到两场比赛而不是一场：

[quote][quote]第一个嵌套引用[/quote][quote]第二个嵌套引用[/quote][/quote]

[quote][quote]第一个嵌套引号[/quote]
1：报价
2：空
3: [quote]第一个嵌套引号

[quote]第二个嵌套引号[/quote]
1：报价
2：空
3：第二个嵌套引用

第一场比赛全部错误，第二场比赛虽然形式良好，但并不是理想的比赛。我们想要一个大匹配，第三个匹配组是两个嵌套的引号标签，就像我们使用第一个表达式时一样。

有什么建议么？如果我能跨越这个差距，我应该有一个相当强大的 BBcode 表达式。

Using 平衡组 http://msdn.microsoft.com/en-us/library/bs2twtah.aspx#balancing_group_definition你可以构造一个像这样的正则表达式：

(?>
  \[ (?<tag>[^][/=\s]+) \s*
  (?: = \s* (?<val>[^][]*) \s*)?
  ]
)

(?<content>
  (?>
    \[(?<innertag>[^][/=\s]+)[^][]*]
    |
    \[/(?<-innertag>\k<innertag>)]
    |
    [^][]+
  )*
  (?(innertag)(?!))
)

\[/\k<tag>]

根据Kobi的例子进行简化。

在下面的：

[foo=bar]baz[/foo]
[b]foo[/b]
[i][i][foo=bar]baz[/foo]foo[/i][/i]
[i][i][i][i]foo[/i][/i][/i][i][i]foo[/i][/i][/i]
[quote][quote][b][img]foo[/img][b]bold[/b][b][b]deep[/b][/b][/b][/quote]bar[quote]baz[/quote][/quote]

它找到这些匹配项：

[foo=bar]baz[/foo]
[b]foo[/b]
[i][i][foo=bar]baz[/foo]foo[/i][/i]
[i][i][i][i]foo[/i][/i][/i][i][i]foo[/i][/i][/i]
[quote][quote][b][img]foo[/img][b]bold[/b][b][b]deep[/b][/b][/b][/quote]bar[quote]baz[/quote][/quote]

完整示例位于http://ideone.com/uULOs http://ideone.com/uULOs

（旧版http://ideone.com/AXzxW http://ideone.com/AXzxW)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何修复 BBcode 正则表达式的相关文章

如何自定义 ASP.Net Core 模型绑定错误？

我只想从我的 Web API Asp net Core 2 1 返回标准化的错误响应但我似乎不知道如何处理模型绑定错误该项目刚刚从 ASP NET Core Web 应用程序 gt API 模板创建我有一个简单的操作定义为 Route
ASP.NET Core 中 AsNoTracking 的模拟或更好的解决方法

您如何模拟 AsNoTracking 或者是否有更好的解决方法来解决此问题 Example public class MyContext MyContextBase Constructor public MyContext DbContex
是否返回 std::move (x)？

Are std vector
是否可以获取指向装箱非托管值类型的指针？

是否可以获取指向装箱非托管值类型的指针而无需编写对每个支持的类型进行强制转换的大型 switch 语句就像是 object val Contains a boxed unmanaged value such as int long by
在 C++ 中初始化指针

可以在声明时将指针分配给值吗像这样的东西 int p 1000 是的您可以在声明时初始化指向值的指针但是您不能这样做 int p 1000 是个地址运算符并且您不能将其应用于常量尽管如果可以那会很有趣尝试使用另一个变量 int
二维数组的列求和

我有一个IEnumerable
本地主机和 request.Url.Authority

我的应用程序通过 URL 中的公司标识符分隔用户 company1 app com company2 app com 我正在本地 PC 上进行测试请求如下 company1 localhost com 但是我的 request Url
使用 C# 和 .NET Core 在 AWS Cognito 用户池中进行用户管理

如何使用 C 和 NET Core 3 x 管理 AWS Cognito 用户池中的用户在文档中找不到有关它的任何内容 Attilio Gelosa 的原创文章我写这篇文章是希望对其他人有帮助我必须阅读一页又一页的文档并从 AWS
如何将对 System.Data.DataSetExtensions 的引用添加到网站 ascx.cs 文件？

我们正在处理一个网站项目并尝试参考System Data DataSetExtensions 使用 Web 应用程序会更好不过技术主管有她的理由这是我们尝试过的找到装配路径打开 Visual Studio 命令提示符并运行sn e
运行 Aero 时如何确定实际窗口窗体大小（包含所有非客户端元素）？

我试图将我的表单精确定位在任务栏上方不幸的是我的努力受到了以下事实的阻碍 this Height在我的表单上返回一个比实际表单包含所有边框标题栏等小 10 像素的值我正在运行带 Aero 的 Windows 7 当 Aero 关
当 C 中没有足够的内存用于静态分配时会发生什么？

当您动态分配内存时例如malloc 1024 sizeof char 结果指针设置为NULL如果没有足够的可用内存来满足请求当没有足够的内存来满足静态分配时会发生什么例如char c 1024 char c 1024 不一定是静态分配
为什么我从 c# 到 js 得到不同的 MD5 哈希值？

我有一个用于加密密码的 C 函数 System Security Cryptography MD5CryptoServiceProvider md5Provider new System Security Cryptography MD5C
Silverlight 4 PLINQ

我有一个非常简单的问题是否可以将 PLINQ 与 Silverlight 4 一起使用因为它似乎不存在于最常引用的程序集中它不受支持但您可以在这里投票 http dotnet uservoice com forums 4325 si
std::iota 的 iota 代表什么？

我假设 i 是增量 a 是分配但我无法弄清楚或找到答案而且它看起来与非标准非常相似itoa我认为这很令人困惑 C iota is not an acronym or an initialism It is the word iota
使用 QTestLib 时抑制 qDebug

我正在向 Qt 中的项目添加单元测试并希望使用 QTestLib 我已经设置了测试并且它们运行良好问题是在项目中我们重写了 qDebug 以输出到我们自己的日志文件这在运行应用程序时效果很好问题是当我测试类时它有时会开始记录然后
使texture2D在运行时/脚本Unity3D中可读[重复]

这个问题在这里已经有答案了我有一个插件可以让我访问 Android 手机图库中的图片这给了我一个Texture2D类型的纹理然后我想使用 GetPixels 函数对其进行编辑但默认情况下它未设置为可读如何使纹理可读以便我可以在
如何在您的网站中连接两个人

有一款名为 Verbosity 的游戏这是一款有目的的游戏位于此链接上www gwap com 在游戏中他们随机连接两个玩家互相玩游戏是玩家1应该向他的搭档玩家2 描述一个单词而玩家2应该猜测这个单词我正在尝试建立一个网站来执
从“class”名称中删除/替换不需要的前缀信息

我正进入状态style从后端它带有不需要的前缀我会替换没有前缀的相同内容正确的方法是什么这就是我得到的
C# 中的快速字符串解析

在 C 中解析字符串最快的方法是什么目前我只是使用字符串索引 string index 并且代码运行合理但我忍不住认为索引访问器所做的连续范围检查必须添加一些东西所以我想知道我应该考虑哪些技术来增强它这些是我最初的想法问题使用
使用 Crypto++ 和 .NET 的 CFB 模式下的 TripleDES

我正在尝试使用 TripleDES 使用 C 应用程序获得相同的结果该应用程序具有Crypto https www cryptopp com 和 NET应用程序使用三重DESCryptoServiceProvider https msdn

随机推荐

Dlib面部标志起始指数

我正在使用 dlib 来获取面部标志点我的问题是关于索引 68 个地标的参考图是从 1 开始的是dlib代码Dlib 面部标志 https github com davisking dlib blob master examples
Python 多重处理和组合 DF

我正在将一个大数据源读入 pandas 并将其分成 3 个块我想使用多重处理以便我可以同时完成每个块的分析功能每个函数之后的输出是一个数据帧然后我需要组合这三个小数据框 This part creates an empty data
如何将导航栏存储在一个文件中？

我的网站有一个导航栏 div ul li a href index html Home a li li a href about html About Us a li li a href http www brownpapertickets
Web 部署 3 (IIS) 的自动备份 - 在备份中排除文件夹

我已成功通过以下方式设置 Web 部署自动备份本指南 http www iis net learn publish using web deploy web deploy automatic backups 效果很好但是在我的网站中我
$在mongodb查询中分别展开2个字段

我想要 unwind2 个字段 school and home 数据库结构就像 id 1 school path school1 code code1 path school2 code code2 path school3 code co
是否可以使用 PropTypes 来验证类似 Dictionary 的对象？

我需要在我的减速器中验证类似字典的对象但由于我已经在使用 Babel 所以我不想求助于 Typescript 等工具以此对象为例 posts byId post1 id post1 author user1 body comments
url 的最大重试次数超出（无法建立新连接：[Errno 110] 连接超时）

raise ConnectionError e request request requests exceptions ConnectionError HTTPSConnectionPool host mycompanyurl in por
在 Powershell 上获取行号？

所以我一直在寻找但找不到任何不会给我带来任何回报的东西我有一个带有变量的代码并且有一个包含很多行的文件例如我有以下文件 things txt Ketchup Mustard Pumpkin Mustard Ketchup 而我要取
复选框绑定 CHANGE 事件

我想在用户单击触摸复选框后提交表单 THE HTML
如何在c中通过指针传递二维数组[重复]

这个问题在这里已经有答案了可能的重复将表示二维数组的指针传递给 C 中的函数 https stackoverflow com questions 5329107 passing a pointer representing a 2d a
LLVM 6.0.0 的构建大小很大 (42G)

I built llvm 6 0 0从源头开始一切正常我只是想知道它的尺寸怎么这么大 42G 我可以轻松删除一些目标文件或其他文件以使构建目录更小吗 du hs GIT llvm 6 0 0 build 42G home oren GI
当 Bash 脚本编写和捕获输出时，在后台使用与号 (&) 分叉命令

我希望在后台分叉一个进程同时捕获 bash 脚本中的输出我可以运行以下脚本来 ping IP 列表它将每个调用移至后台并且运行速度非常快但它不会捕获执行命令的输出以供进一步处理 for i in cat list txt do pi
如何在 Visual C++ 2008 中创建 UTF-8 字符串文字

在 VC 2003 中我可以将源文件保存为 UTF 8 并按原样使用所有字符串换句话说以下代码将按原样将字符串打印到控制台如果源文件保存为 UTF 8 则输出将为 UTF 8 printf Chinese Traditional p
Intel Fortran 错误 #6633：实际参数的类型与虚拟参数的类型不同

对于可能在这里提出这样一个基本问题我深表歉意我是使用英特尔 Fortran 编程的新手所以我认为在这种情况下我不知道有一些东西丢失或组织错误如果有人能在这方面帮助我我将不胜感激问题是我在编译代码时看到以下错误而我相信我已经声
如何在 Android 上创建渐进式 JPEG 图像

我需要通过very来自 Android 手机的低带宽连接低至 10kByte s 并希望以渐进隔行模式发送它们以便另一端的用户在漫长的传输过程中开始看到图像现在我正在使用常规照片应用程序创建图像 Intent takePictu
突变观察者 - DOM 通过回调函数改变

有没有办法如何强制突变观察者忽略回调函数引起的 DOM 变化现在我有 var config attributes true childList true characterData true var target document bo
如何在 Visual Studio 中获得 .feature 文件的 Gherkin 语法突出显示？

默认情况下 Feature Scenario Given When Then 等关键字不会突出显示是否有现成的模板可以实现此目的最新版本SpecFlow http www specflow orgVS2010有一个内置的语法高亮
通过绘图下拉菜单切换显示的迹线

我正在使用 R 编程语言我试图在这里复制本教程以获取我自己的数据 https plotly com r dropdowns https plotly com r dropdowns 我创建了一些假数据并绘制了 4 个图 load libr
Rails.env 与 RAILS_ENV

在检查运行环境时我在示例中看到了这两种情况首选什么就所有意图和目的而言它们是否平等根据文档 http api rubyonrails org classes Rails html method c env Rails env wr
如何修复 BBcode 正则表达式

我有一个获取 BBcode 标签的正则表达式除了一个小故障之外它工作得很好这是当前的表达式 x22 x22 1 以下是它成功匹配的一些文本及其构建的组 url http www google com 去 http www google

如何修复 BBcode 正则表达式

如何修复 BBcode 正则表达式 的相关文章

随机推荐

热门标签

如何修复 BBcode 正则表达式的相关文章