python 正则表达式中括号的奇怪行为

2024-05-02

我正在编写一个 python 正则表达式，它可以在文本文档中查找引用的字符串（从黑匣子中记录的航空公司飞行员的引用）。我首先尝试编写具有以下规则的正则表达式：

返回引号之间的内容。
如果以 single 打开，则仅在以 single 关闭时返回。
如果以 double 开头，则仅在以 double 结尾时返回。

例如，我不想匹配“嗨那里”或“嗨那里”，而是匹配“嗨那里”和“嗨那里”。

我使用一个测试页面，其中包含以下内容：

CA  "Runway 18, wind 230 degrees, five knots, altimeter 30."
AA  "Roger that"
18:24:10 [flap lever moving into detent]
ST: "Some passenger's pushing a switch. May I?"

所以我决定从简单开始：

 re.findall('("|\').*?\\1', page)
 ########## /("|').*?\1/ <-- raw regex I think I'm going for.

这个正则表达式的行为非常出人意料。
我以为会：

( " | " ) 匹配单引号或双引号，保存为反向引用 /1。
.*？匹配非贪婪通配符。
\1 匹配在反向引用 \1 中找到的任何内容（第一步）。

相反，它返回一个引号数组，但不返回任何其他内容。

['"', '"', "'", "'"]

我真的很困惑，因为等效的（据我所知）正则表达式在 VIM 中工作得很好。

\("\|'\).\{-}\1/)

我的问题是这样的：
为什么它只返回括号内的内容作为匹配项？这是我对反向引用的理解中的一个缺陷吗？如果是这样那为什么它在 VIM 中有效？

如何在 python 中编写我正在寻找的正则表达式？

感谢您的帮助！

除了引号之外，您没有捕获任何内容，这是 Python 返回的内容。

如果添加另一个组，事情会更好：

for quote, match in re.finditer(r'("|\')(.*?)\1', page):
  print match

我在你的字符串文字前面加上了前缀r使其成为raw字符串，当您需要使用大量反斜杠时，这很有用（\\1变成\1).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

quotes

Parentheses

backreference

python 正则表达式中括号的奇怪行为的相关文章

使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
Tkinter 菜单删除项

如何删除任何菜单项例如我想删除播放 self menubar Menu self root self root config menu self menubar self filemenu2 Menu self menubar self
在 Java 正则表达式中获取多个模式的重叠匹配

我有同样的问题这个链接 https stackoverflow com questions 18751486 matching one string multiple times using regex in java 但有多种模式我的正
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
如何使用 Python boto3 获取 redshift 中的列名称

我想使用 python boto3 获取 redshift 中的列名称创建Redshift集群将数据插入其中配置的机密管理器配置 SageMaker 笔记本打开Jupyter Notebook写入以下代码 import boto3
Slim 3 - 斜杠作为路由参数的一部分

我需要使用可以包含斜杠的参数来编写 URL 例如经典的 hello username 路线默认情况下 hello Fabien将匹配此路线但不匹配 hello Fabien Kris 我想问你如何在 Slim 3 框架中做到这一点
如何使用 opencv python 计算乐高积木上的孔数？

我正在开发我的 python 项目我需要计算每个乐高积木组件中有多少个孔我将从输入 json 文件中获取有关需要计算哪个程序集的信息如下所示 img 001 red 0 blue 2 white 1 grey 1 yellow 1 r
python 中的 h2o 框架子集

如何在 python 中对 h2o 框架进行子集化如果 x 是一个 df 并且 Origin 是一个变量那么在 pandas 中我们通常可以通过以下方式进行子集化 x x Origin AAF 但使用 h2o 框架会出现以下错误 H2O
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
将字符串中的随机字符转换为大写

我尝试随机附加文本字符串这样就不只是有像这样的输出 gt gt gt david 我最终会得到类似的东西 gt gt gt DaViD gt gt gt dAviD 我现在的代码是这样的 import random import stri
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
PyQt5：如何使QThread返回数据到主线程

I am a PyQt 5 4 1 1初学者我的Python是3 4 3 这是我尝试遵循的many https mayaposch wordpress com 2011 11 01 how to really truly use qthr
非法指令：MacOS High Sierra 上有 4 条指令

我正在尝试在 pygame 3 6 中制作一个看起来像聊天的窗口我刚刚将我的 MacBook 更新到版本 10 13 6 在我这样做之前它工作得很好但在我收到消息之后非法指令 4 Code import pygame from pyg
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
Jupyter Notebook：带有小部件的交互式绘图

我正在尝试生成一个依赖于小部件的交互式绘图我遇到的问题是当我使用滑块更改参数时会在前一个绘图之后完成一个新绘图而我预计只有一个绘图会根据参数发生变化 Example from ipywidgets import interact i
如何使用xlwt设置文本颜色

我无法找到有关如何设置文本颜色的文档在 xlwt 中如何完成以下操作 style xlwt XFStyle bold font xlwt Font font bold True style font font background col

随机推荐

在 python 中返回 self [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个代表对象的类我有很多方法可以修改这个对象状态没有明显的返回或显然没有任何返回在 C 中我会将所有这些方法声明为void
如何在jpanel上延迟显示图片？

这是我遇到问题的代码部分我应该每 5 秒显示一次图片但它不起作用我希望你能帮忙谢谢编辑 5秒后所有图片一起显示 JButton btnGenerateNumber new JButton Generate Number btnGe
AWS Lambda - 在区域之间自动复制 EC2 快照？

我想创建一个 Lambda 函数 python 它将自动将已创建的快照复制到另一个区域我已联系 AWS Support 他们只向我发送了用于 RDS 数据库的 GitHub 脚本没有 EC2 快照复制脚本任何帮助都会很棒谢谢是的
使用自定义元素类在 Python 中解析 xml

我想使用 Python 的 xml etree ElementTree 模块解析 xml 文档但是我希望生成的树对象中的所有元素都具有我定义的一些类方法这建议创建我自己的 Python 元素类的子类但我无法告诉解析器在解析时使用我自
如何从 Emacs 中运行 Cygwin Bash Shell？

我在 Windows 上运行 GNU Emacs 因此输入 M x shell 启动 Windows 命令行 DOS shell 但是我希望能够从 Emacs 中运行 Cygwin Bash Shell 或任何其他非 Windows sh
android studio 中 xml 文件的设计预览无法“打开”

我在制作一个 Android 项目时遇到了一个问题更新 android studio 后我的 xml 文件之一设计预览将无法打开我收到 2 个错误我已经寻找了解决方案并且已经尝试了很多我在网上找到的东西但都没有改变这种情况第一
从 Rcpp C++ 函数获取 r 函数参数

我在 R 端定义了一个函数如下所示 foo lt function arg1 arg2 arg3 以及使用 Rcpp 的 C 函数该函数获取全局环境并实例化 R 函数以从该函数执行它这是代码 namespace Rcpp void m
使用 javascript 获取选择标签的名称

我在任何地方都没有找到这个问题所以我将其发布在这里我有一堆选择标签部分使用 VBScript 命名我希望能够获取从 javascript 中的 onchange 事件调用的选择标签的名称这是代码
向项目添加资源的设计

我有课Project Resource and File where A Project包含列表资源 Each Resource包含以下列表Files特定类型的这被映射到 XML
在基于 RESTful 的应用程序中管理状态

我们正在评估用于基于 Web 的应用程序的技术一些建议是采用基于 RESTful 的服务方法技术堆栈 1 春天 2 Apache CXF JAX RS 我的问题是 1 如何在请求之间管理状态例如用户已经过身份验证现在他正在发出一系
Python 3：如何更改GDAL中的图像数据？

我有一个 GeoTIFF 图像其中包含颜色表和带有 8 位表键的单个栅格带并且使用 LZW 压缩我加载该图像gdal Open https gdal org python osgeo gdal module html 我还有一个包含
shell进程的并行执行

有没有一个工具可以在 Windows 批处理文件中并行执行多个进程我发现了一些有趣的 Linux 工具 parallel http mi eng cam ac uk er258 code parallel html and PPSS ht
JS中的递归排序

在一次采访中我被要求编写一个程序算法来使用递归对数字数组进行排序虽然我含糊地回答了它但我尝试并想出了以下代码您可以使用以下JSFiddle https jsfiddle net RajeshDixit 2u9mLegv 1 链接来
Twitter 个人资料图像 API 已弃用

我正在使用 Twitter API 版本 1 并将其替换为 v1 1 然后我在 1 1 版本上找不到 users profile image screen name API https api twitter com 1 users pro
安卓中的界面

我在 android 中编写了一个包含图像和视频视图的表格布局我想在 android 中编写一个界面它将在不干扰我的布局的情况下获取图像以及数据和视频该数据可以采用任何形式来自任何来源并且必须通过接口提供给布局我应该如何为我在a
如何重构这些 switch case 以处理用户在自然语言中的选择？

我正在编写几个嵌套的 switch 语句在某些地方有很多情况我试图找出一种方法来创建一个案例列表然后在以后的 switch 语句中引用有没有办法做到这一点它肯定会清理我的代码例如我有四个单独的案例来回答是我正在寻找一种方法
如何在Python中通过URL下载Azure Blob存储文件？

我正在尝试从我的存储帐户下载 Azure Blob 存储文件为此我检查了 URL 是什么并且正在执行以下操作 with urllib request urlopen
使用 Spring 通过构造函数自动装配集合

我有一个看似简单的问题如标题所示这是我的课程类型 public class Foo Autowired public Foo Qualifier bar Set
正则表达式匹配7-12位数字；可能包含空格或连字符

我已经尝试解决 PHP 正则表达式问题有一段时间了但我就是无法完全完成我需要编写一个匹配 7 到 12 位数字 0 9 的正则表达式并且可以选择在相邻数字之间有一个连字符或一个空格这就是我到目前为止所拥有的 match1 preg
python 正则表达式中括号的奇怪行为

我正在编写一个 python 正则表达式它可以在文本文档中查找引用的字符串从黑匣子中记录的航空公司飞行员的引用我首先尝试编写具有以下规则的正则表达式返回引号之间的内容如果以 single 打开则仅在以 single 关闭时返回

python 正则表达式中括号的奇怪行为

python 正则表达式中括号的奇怪行为 的相关文章

随机推荐

热门标签

python 正则表达式中括号的奇怪行为的相关文章