正则表达式匹配回句点或字符串开头

2024-02-27

我想匹配一个单词，然后获取它之前的所有内容，直到第一次出现一个句点或字符串的开头。

例如，给定此字符串并搜索单词“regex”：

s = 'Do not match this. Or this. Or this either. I like regex. It is hard, but regex is also rewarding.'

它应该返回：

>> I like regex.
>> It is hard, but regex is also rewarding.

我试图让我的头脑向前看和向后看，但是（似乎）你不能轻易回头until你击中了某个东西，前提是它紧邻你的模式。我可以非常接近这个：

pattern = re.compile(r'(?:(?<=\.)|(?<=^))(.*?regex.*?\.)')

但它给了我第一个句点，然后是“正则表达式”之前的所有内容：

>> Do not match this. Or this. Or this either. I like regex.  # no!
>> It is hard, but regex is also rewarding.                   # correct

您不需要使用环视来做到这一点。否定的字符类是你最好的朋友：

(?:[^\s.][^.]*)?regex[^.]*\.?

[^.]*regex[^.]*\.?

这样，您就可以在“regex”一词之前获取任何字符，并禁止这些字符中的任何字符成为点。

第一个图案在左侧留下空白条纹，第二个图案更为基本。

关于你的模式：

不要忘记，正则表达式引擎会尝试在字符串从左到右的每个位置上取得成功。这就是为什么像(?:(?<=\.)|(?<=^)).*?regex即使您使用非贪婪量词，也不总是返回点或字符串开头与单词“regex”之间的最短子字符串。最左边的位置总是获胜，并且非贪婪量词会获取字符，直到下一个子模式成功。

顺便说一句，否定的字符类可能会很有用：
削减(?:(?<=\.)|(?<=^))你可以写(?<![^.])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

正则表达式匹配回句点或字符串开头的相关文章

使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
更改 Inkscape 的 Python 解释器

在使用 Inkscape 时我不断收到错误这似乎意味着未满足 python 2 vs 3 的期望尽管我已经安装了它们例如当我尝试从模板生成新文档时我得到 Traceback most recent call last File
如何将经度和纬度转换为国家或城市？

我需要将经度和纬度坐标转换为国家或城市 python中有这样的例子吗提前致谢我使用谷歌的API from urllib2 import urlopen import json def getplace lat lon url http
使用 Flask SQLAlchemy 进行表（模型）继承

我遵循了这个建议question https stackoverflow com questions 1337095 sqlalchemy inheritance但我仍然收到此错误 sqlalchemy exc NoForeignKeysE
如何编写高效的配对算法？

我需要一种算法的帮助该算法可以有效地将人们分组并确保以前的配对不会重复例如假设我们有 10 位候选人 candidates 0 1 2 3 4 5 6 7 8 9 并假设我们有一个先前匹配的字典这样每个键值对即candidate
代理阻止网络套接字？如何绕行

我有一个用 Python 编写的正在运行的 websocket 服务器来自https github com opiate SimpleWebSocketServer https github com opiate SimpleWebSoc
keras 预测内存交换无限期增加

我使用keras实现了一个分类程序我有一大组图像我想使用 for 循环来预测每个图像然而每次计算新图像时交换内存都会增加我尝试删除预测函数内部的所有变量并且我确信该函数内部存在问题但内存仍然增加 for img in ima
将带有两层分隔符的字符串转换为字典 - python

给定一个字符串 s x t1 ny t2 nz t3 我想转换成字典 sdic x 1 y 2 z 3 我通过这样做让它工作 sdic dict tuple j split t for j in i for i in s split n F
Python：使用列表创建二叉搜索树

我的代码的目标是从 txt 文件中获取每个单独的单词并将其放入列表中然后使用该列表创建二叉搜索树来计算每个单词的频率并按字母顺序打印每个单词及其频率中的每个单词只能包含字母数字或我无法用我的初学者编程知识来做的部分是使用我拥有的
如何使用 python-gnupg 加密大型数据集而不占用所有内存？

我的磁盘上有一个非常大的文本文件假设它是 1 GB 或更多还假设该文件中的数据有 n每 120 个字符一个字符我在用python gnupg https pythonhosted org python gnupg 对此文件进行加密由
从 subprocess.Popen 获取整个输出

我通过调用 subprocess Popen 得到了一个有点奇怪的结果我怀疑这与我对 Python 的陌生有很大关系 args cscript USERPROFILE tools jslint js USERPROFILE tools j
tweepy 流到 sqlite 数据库 - 语法错误[重复]

这个问题在这里已经有答案了可能的重复 tweepy 流到 sqlite 数据库语法无效 https stackoverflow com questions 9434205 tweepy stream to sqlite database
python 的 fcntl.flock 函数是否提供文件访问的线程级锁定？

Python 的 fcnt 模块提供了一种名为 flock 1 的方法来证明文件锁定其描述如下对文件执行锁定操作op 描述符 fd 文件对象提供 fileno 方法被接受为出色地请参阅 Unix 手册集群 2 了解详情在某些系统上
std::regex 转义正则表达式中使用的特殊字符

我是字符串来创建一个std regex FILE 作为单元测试的一部分检查一些打印文件名的异常输出在 Windows 上失败并显示 regex error error escape 表达式包含无效的转义字符或尾随转义因为 FILE 宏
如何在 Pandas 数据框中用 NaN 替换一系列值？

我有一个巨大的数据框我应该如何用 NaN 替换一系列值 200 100 数据框您可以使用pd DataFrame mask https pandas pydata org pandas docs stable generated pan
如何在 Python 中解析损坏的 XML？

我无法影响的服务器发送的 XML 非常损坏具体来说 Unicode WHITE STAR 将被编码为 UTF 8 E2 98 86 然后使用 Latin 1 转换为 HTML 实体表我得到的是 acirc 98 86 9 个字节位于声
在没有numpy的情况下在python中分配变量NaN

大多数语言都有一个 NaN 常量您可以使用它为变量分配值 NaN python 可以在不使用 numpy 的情况下做到这一点吗是的使用math nan https docs python org 3 library math html
提供节点名或服务名，或未知

我收到这个 Python 错误 File Library Frameworks Python framework Versions 2 7 lib python2 7 urllib2 py line 1184 in do open rais
如何获取所有Python标准库模块的列表？

我想要类似的东西sys builtin module names标准库除外其他不起作用的事情 sys modules 只显示已经加载的模块 sys prefix 包含非标准库模块并且似乎无法在 virtualenv 内工作的路径我想要这
将笔记本生成的 HTML 片段转换为 LaTeX 和 PDF

在我的笔记本里有时会有 from IPython display import display HTML display HTML h3 The s is important h3 question of the day 但当我后来将笔记本

随机推荐

在 SQL 中编写左/右 JOIN 时，您是否使用 OUTER 关键字？

我经常看到有人这样写SQL SELECT from TableA LEFT OUTER JOIN TableB ON ID1 I2 我自己简单写一下 SELECT from TableA LEFT JOIN TableB ON ID1 I2
Jetpack Compose 中可调整大小的 BasicTextField

有没有办法在 Jetpack Compose 中生成可调整大小的 BasicTextField 以便在用户输入或删除字符时其宽度会环绕文本大小他们已经解决了 flutter 的类似问题但我没有找到如何为 Compose 解决这个问题 F
通过 Entity Framework 6.0、Fluent API 和 DataAnnotations 重用所需属性的列

我有一个基类 public class BaseClass public int Id get set 和两个派生类 public class Foobar BaseClass Required public int Whatever ge
HealthKit 中的错误：错误 Domain=com.apple.healthkit Code=100“无法打开数据库”UserInfo= {NSLocalizedDescription=无法打开数据库}

尝试使用 HealthKit API 进行授权时我们在某些设备上遇到错误对 HKHealthStore requestAuthorizationToShareTypes 的调用始终失败并出现以下错误并且系统生成的允许访问 Heal
Spark 2 的 hbase-spark

我想要进行全面扫描hbase from Spark 2 using Scala 我没有固定的目录定义因此库为SHC https github com hortonworks spark shc不是一个选择我的逻辑选择是使用 hbase
Android，如何创建上下文菜单...

在这里我写了一些代码但没有得到输出请告诉我为什么不显示该上下文菜单我在哪里做错了请指导我提前谢谢更多选项卡菜单 xml menu menu
Unity 同一物体上的多个碰撞器

我在同一个游戏对象上使用多个盒子碰撞器问题是是否可以使用单独引用每个碰撞器gameObject getComponent enabled false 请记住我的碰撞器很少我希望其中一些碰撞器保持启用状态而其他碰撞器将被禁用我所做
通过 jest mock 测试 catch 块

我试图通过玩笑来测试异步 redux 操作的 catch 块但是在模拟中抛出一个 catch 会导致整个测试失败我的行动如下 export function loginUser username password return asyn
使用 Google Apps 脚本操作 DOM

是否可以隐藏 display none 某些标签并使用 Google Apps 脚本更改 Gmail 下拉列表中的标签顺序标签移动不会 Google Apps 脚本在服务器端运行它无法访问 Gmail Calendar 或 Shee
XStream arrayList 与 XML 之间的转换

我目前不知道问题出在哪里第一次使用 xml 我在将 ArrayList 放入 xml 文件并从中取出它时遇到了一些问题我发现了这个我尝试以同样的方式做如何使用 XStream 将对象列表转换为 XML 文档 https stacko
Python自动选择串口（适用于Arduino）

目前 Python 程序必须知道设备 Arduino 位于哪个端口然后 Python 才能与设备进行通信 Problem 每当设备拔出并重新插入时其 COM 端口都会发生变化因此必须再次向 Python 提供正确的串行端口以便它找到
为什么 Android 6 上没有授予 GCM 权限？

背景我正在尝试调查办公室的应用程序需要更改其权限以便更好地支持 Android 6 问题我发现哪些权限需要确认哪些不需要除了以下一项
运行程序所花费的时间

如何在文本框或输出中打印程序运行时间我希望将其显示到 for 循环中以获取每个 for 循环需要多少时间你可以尝试 DateTime dt DateTime Now for TimeSpan ts DateTime Now dt te
如何使用其他 Angular 组件中的“templateref”？

如何使用templateRef来自其他组件模板文件 I have BatmanComponent SpidermanComponent and a JokerComponent 其中一些具有相似的功能因此我决定创建一个HumanCompo
Xamarin 自定义表视图标头

我想在表视图部分标题的标题中添加一个按钮即加号按钮经过研究发现要做到这一点您必须创建一个自定义标题我不知道该怎么做如何在 xamarin 中为表视图部分创建自定义标头我也使用 Xaml 和 C 请参阅这些博客文章 https
使用自定义字体为警报对话框项目设置字体

我正在这样创建一个警报对话框 AlertDialog Builder alertDialog new AlertDialog Builder view getContext alertDialog setCustomTitle null a
使用 where 和 offset fetch 子句的简单选择在 Oracle 中不起作用

我正在尝试选择行where条件并且需要分页所以我添加了Fetch with offset 使其动态子句但随后它给出了此错误 ORA 00933 SQL 命令未正确结束位置 414 我的查询 SELECT up NAME upozil
是否可以使用ggplot2中的facet_grid()让annotation_logtics()仅出现在一个子图上？

我使用以下代码在 ggplot2 中使用facet grid 创建一个包含三个子图的图 day lt c 5 Aug 5 Aug 5 Aug 10 Aug 10 Aug 10 Aug 17 Aug 17 Aug 17 Aug station
[myArray addObject:[[objcBlock copy] autorelease]] 在释放数组时崩溃

我编写了一个类来声明性地描述 UIView 动画序列我的方法采用动画块的可变参数并将它们放入数组中所以在我的循环中我想这样做 animations addObject block copy autorelease I first cop
正则表达式匹配回句点或字符串开头

我想匹配一个单词然后获取它之前的所有内容直到第一次出现一个句点或字符串的开头例如给定此字符串并搜索单词 regex s Do not match this Or this Or this either I like regex It

正则表达式匹配回句点或字符串开头

正则表达式匹配回句点或字符串开头 的相关文章

随机推荐

热门标签

正则表达式匹配回句点或字符串开头的相关文章