在用户提交的正则表达式中查找捕获组

2024-05-02

我有一个 python 应用程序，需要处理用户提交的正则表达式。出于性能考虑，我想禁止捕获组和反向引用。

我的想法是使用另一个正则表达式来验证用户提交的正则表达式不包含任何命名或未命名的组捕获，如下所示：

def validate_user_regex(pattern):
    if re.match('[^\\\]\((?:\?P).*?[^\\\]\)', pattern) is not None:
        return False
    return True

虽然我认为我的想法可能适用于捕获组，但我不确定这是否会阻止各种反向引用。那么有没有更聪明的方法来防止在正则表达式中捕获组和反向引用呢？

正则表达式语言不是正则语言，因此无法通过正则表达式将其可靠地分割成有意义的部分（请参阅RegEx 匹配除 XHTML 自包含标签之外的开放标签 https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tagsHTML 的情况相同）。

为什么不使用 Python 自己的解析器来做到这一点呢？

>>> r="whate(ever)(?:\\1)"
>>> import sre_parse        #the module used by `re' internally for regex parsing
>>> sre_parse.parse(r)
[('literal', 119), ('literal', 104), ('literal', 97), ('literal', 116),
 ('literal', 101), ('subpattern', (1, [('literal', 101), ('literal', 118), ('lit
eral', 101), ('literal', 114)])), ('subpattern', (None, [('groupref', 1)]))]

正如你所看到的，这是一个解析树，你感兴趣的是subpattern节点与非None在第一个元素和groupref's.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

performance

在用户提交的正则表达式中查找捕获组的相关文章

将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
PHP URL 验证

我知道有无数的线程问这个问题但我一直无法找到一个可以帮助我解决这个问题的线程我基本上试图解析大约 10 000 000 个 URL 的列表确保它们根据以下标准有效然后获取根域 URL 此列表包含您能想象到的几乎所有内容包括类似的内
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
是否有一个包可以维护所有带有符号的货币列表？

是否有一个 python 包提供所有或相当完整货币的列表与符号如美元的有优秀的pycountry 贪财的 https github com limist py moneyed and ccy http code google com
python celery -A 的无效值无法加载应用程序

我有一个以下项目目录 azima init py main py tasks py task py from main import app app task def add x y return x y app task def mul
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
如何在 Django Rest 框架中编写“删除”操作的测试

我正在为 Django Rest Framework API 编写测试我一直在测试删除我对创建的测试工作正常这是我的测试代码 import json from django urls import reverse from re
使用seaborn绘制简单线图

我正在尝试使用seaborn python 绘制ROC曲线对于 matplotlib 我只需使用该函数plot plt plot one minus specificity sensitivity bs where one minus s
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
Discord.py 嵌入中禁用按钮/冻结按钮

I m trying to make a replica of this bot in which when I press any of the buttons below it shows a dropdown menu and you
使用 selenium 和 python 来提取 javascript 生成的 HTML？萤火虫？

这里是Python新手我遇到的是数据收集问题我在这个网站上当我用 Firebug 检查我想要的元素时它显示了包含我需要的信息的源然而常规源代码没有 Firebug 不会给我这个信息这意味着我也无法通过正常的 selenium
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
非法指令：MacOS High Sierra 上有 4 条指令

我正在尝试在 pygame 3 6 中制作一个看起来像聊天的窗口我刚刚将我的 MacBook 更新到版本 10 13 6 在我这样做之前它工作得很好但在我收到消息之后非法指令 4 Code import pygame from pyg
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s
使用 paramiko 运行 Sudo 命令

我正在尝试执行sudo使用 python paramiko 在远程计算机上运行命令我尝试了这段代码 import paramiko ssh paramiko SSHClient ssh set missing host key polic

随机推荐

动态向表变量添加 50 列

我想向定义为变量的表添加大约 50 列这些列的名称来自另一个表基本上它们只是数字 DEPA KEY 部门键是否可以使用循环或类似的东西动态添加这些列表定义为变量这里我想动态添加 50 列 DECLARE USERS TABLE U
如何使用 WEBrick 执行 Ruby 代码而不是将代码转储到浏览器？

当我在浏览器中运行程序时遇到问题WEBrick服务器 http ruby doc org stdlib 2 1 1 libdoc webrick rdoc WEBrick html 它显示了 2loop rb 文件中编写的代码当我跑步时r
区分 AccessoryView 和 Cell Content 上的点击，Apple 会允许吗？（iPhone）

我想知道是否有一个委托方法可以实现让我区分单元格内容视图上的点击和右侧的公开符号我想根据用户点击单元格的位置将用户发送到两个不同的视图我认为该事件通常是通过测试 tableView 是否为以下内容来捕获的自行编辑我只记得在闹钟和地
消息：未定义索引：$_SERVER 中的 REMOTE_HOST

当我尝试检索远程用户的主机名时为什么会出现此错误 Message Undefined index REMOTE HOST 在阅读文档时我了解到它需要在 httpd conf 中启用但我不确定 httpd conf 中需要编辑什么这不
如何在 PyCharm 中启用 flake8 的自动代码格式化

我使用 Tox 运行单元测试并使用 flake8 命令检查代码格式错误每次我在 PyCharm 中编码时我都会运行 tox 然后意识到我有一堆烦人的格式错误我必须返回并手动修复我希望 PyCharm 自动格式化代码根据 flak
在 VueJs 中使用上下键自动完成搜索

除了自动完成搜索之外我还想添加功能以允许使用 VueJs 按下向上键功能我的模板如下所示 div h2 Todos h2 div class autocomplete div div
在 Postgres 9.0+ 中使用 PL/pgSQL 循环表

我想循环遍历所有表以计算每个表中的行数以下查询给我一个错误 DO DECLARE tables CURSOR FOR SELECT tablename FROM pg tables WHERE tablename NOT LIKE pg
使用 rollend 滚动 data.table

我无法获取roll Inf定义时工作rollends FALSE When rollends未设置或设置为TRUE 我看到了预期的结果我将不胜感激任何建议 library data table dt1 data table Date se
如何修复 Eslint 错误“prefer-destructuring”？

我想像这样缩短 ES6 中的对象文字 const loc this props local 原因是loc foo 比打字容易得多this props local foo 但现在 ESLint 抱怨道使用对象解构 prefer destru
在应用程序退出时保存 Android 应用程序数据

看来关于保存的信息量很大Activity状态但我一直无法找到太多的信息应用 state 我正在寻找一些设计想法来解决我遇到的问题我正在开发一个具有相当大的数据模型 1 2 MB 的游戏该模型存在于任何 Activity 之外事实上有
Rails form_for :remote=>true 没有调用 js 方法

我不知道为什么这不起作用我正在学习 Rails 我正在关注一本书它说要这样做 div class field div div class field div
退回 10 天后结束的拍卖

我的 api xml 对于从当前到 10 天结束的返回拍卖工作正常但对于 10 天后结束的列表不起作用这是我下载结果的方式 public string DownLoad string url used to build entire i
使用底图和Python在地图中绘制海洋

我正在绘制此处提供的 netCDF 文件 https goo gl QyUI4J https goo gl QyUI4J Using the code below the map looks like this 然而我希望海洋是白色的更
PHP 按值合并数组以获得 2 个不同的数组值

我尝试将两个不同的数组合并为一个数组有人可以帮我吗我有这样的数组 0 Array 2 rank 579 id 1 1 Array 4 rank 251 id 2 0 Array 2 size S rank 251 1 Array 15
如何使用带有 > 1 个参数的选择器调用 PerformSelectorOnMainThread: ？

典型的调用performSelectorOnMainThread 看起来像这样 target performSelectorOnMainThread action withObject foo waitUntilDone NO 其中结果
将 javascript 变量作为 onsubmit href 链接传递到表单/输入字段

id 喜欢有一个输入框用户可以在其中输入搜索词该搜索词可能会传递给一个 javascript 函数然后该函数将一些 url 段与搜索词组合起来创建一个完整的 url 到目前为止它在没有表单的情况下工作正常但我想向其中添加一个表单
Windows XP 风格：为什么我们在静态文本小部件上得到深灰色背景？

我们正在使用 C 和 Win32 编写 Windows 桌面应用程序我们的对话框具有 Windows XP 风格的丑陋外观静态文本的背景是灰色的如果对话框背景也是灰色这不是问题但在背景为白色的选项卡控件内文本的灰色背景非常明显
Eclipse 上的 Android 开发：始终打开新的模拟器

这应该是一个非常简单的问题我正在做 Hello Android 教程我能够将我的应用程序安装到模拟器中然而当我再次运行没有任何更改时 Eclipse 环境坚持启动一个新的模拟器而不是连接到现有的模拟器我该如何解决这个问题我
Java Swing - 在运行时动态切换语言环境

我了解如何国际化 java 程序但我有一个问题我的程序中的语言可以随时切换但我的程序可以存在多种状态这意味着它可能会也可能不会打开多个 JLabels JPanel JFrame 等是否有一个类或方法可以将当前的 GUI 更新为切
在用户提交的正则表达式中查找捕获组

我有一个 python 应用程序需要处理用户提交的正则表达式出于性能考虑我想禁止捕获组和反向引用我的想法是使用另一个正则表达式来验证用户提交的正则表达式不包含任何命名或未命名的组捕获如下所示 def validate user r

在用户提交的正则表达式中查找捕获组

在用户提交的正则表达式中查找捕获组 的相关文章

随机推荐

热门标签

在用户提交的正则表达式中查找捕获组的相关文章