Python中字符串中重复字符的正则表达式

2024-03-15

我是正则表达式的新手。我有一个正则表达式，可以从字符串中删除重复字符。

>>> self.repeat_regexp = re.compile(r'(\w*)(\w)\2(\w*)')
>>> self.repl = r'\1\2\3'

上面两行代码去掉了重复字符。例如，loooooooove去love.

但我想更改正则表达式模式，以便仅当重复字符重复超过 3 次时才进行替换。预期输出：

cannot  ---> cannot
loooooooove ----> love

我不明白正则表达式r'(\w*)(\w)\2(\w*)' and r'\1\2\3'如果以可理解的方式解释上述正则表达式将会很有帮助。

我不明白正则表达式 --> r'(\w*)(\w)\2(\w*)' 和 r'\1\2\3' 如果将上述正则表达式解释为可以理解的方式。

好了，走吧：

(\w*)是任何一种单词字符（字母、数字、下划线 - 根据区域设置而变化，可以包含带有重音符号的法语字母），零次或多次（通过使用量词 *).

接下来，它尝试仅匹配一个单词字符(\w)– 然后再次使用相同的字符\2，这是一个反向参考到表达式中的第二个匹配项，即\w之前匹配的字符。

之后，又是零个或多个单词字符，与开始时相同。

如果该表达式匹配，则self.repl = r'\1\2\3'再次使用反向引用将其替换为所做的匹配捕获子模式在搜索模式中使用括号。

因此，每个匹配的部分都会被自身替换 - 除了重复的字符匹配之外\2，它没有分组括号。

因此，如果您想让重复的字符至少出现三次，您可以将表达式的该部分修改为(\w)(\2{2,})' – {2,}是另一个量词，表示“仅当前面的模式出现至少两次时才匹配”。（仅有的至少两次，因为第一个字符与前面的字符匹配(\w)已经。）

我没有使用前导和尾随让它工作(\w*)虽然 - 但由于这些也匹配零字字符，我认为它们可以完全被抛弃。

所以这应该可以实现您想要实现的目标：

self.repeat_regexp = re.compile(r'(\w)(\1{2,})')
self.repl = r'\1'

（因为我在这里删除了领先的捕获子模式，\2被替换为\1，引用现在第一个捕获子模式。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

python27

Python中字符串中重复字符的正则表达式的相关文章

[Regex]::Replace() 和 -replace 有什么区别？

我明白了之间的区别 Replace and replace 但是什么是 replace and Regex Replace 我测试了以下两个代码但对我来说结果完全相同我还提到了 PowerShell Cookbook O reilly
在 Java 正则表达式中获取多个模式的重叠匹配

我有同样的问题这个链接 https stackoverflow com questions 18751486 matching one string multiple times using regex in java 但有多种模式我的正
如何在 jQuery 中将标题转换为 URL slug？

我正在 CodeIgniter 中开发一个应用程序我试图在表单上创建一个字段来动态生成URL slug 我想做的是删除标点符号将其转换为小写然后用连字符替换空格例如 Shane s Rib Shack 将变成 shanes rib
git 匹配多个单词的标签

我们可以得到最后一个 git 标签它以一个单词例如 TEST 开头如下所示 git describe tag dirty match TEST 我想知道如何获得最后一个以 word1 开头的标签orword2 例如测试OR跑步我尝试
PHP 中的 Preg_replace

我想替换中包含的字符串中的内容content 它是多行等 preg replace 函数应该删除整个 com 没有垫子蒙特尝试这个 result preg replace s replacement content subject
正则表达式：无法找出与单个事件匹配的表达式，并且仅匹配包含特定单词的行

我正在尝试使用 Sublime Text 作为编辑器清理并合并一些旧的日历文件 x ics 打开文件会得到一个长文件如下所示我想删除即替换为任何内容文件中在摘要中提及生日的所有条目 VEVENT 并保留所有其他条目因此我使用正则表
Word通配符搜索的正则表达式查找包含至少3个连续数字的括号

在以下示例中 airspeed AS user 104A 104B device 101 vehicles 105A C 搜索应该找到 104A 104B 101 and 105A C 但不是 AS 我尝试使用 0 9 0 9 0 9 但这
正则表达式获取字符串中的第一个数字和其他字符

我是正则表达式的新手想知道如何才能只获取字符串中的第一个数字例如100 2011 10 20 14 28 55 在这种情况下我希望它返回100 但该数字也可以更短或更长我在想类似的事情 0 9 但它单独获取每个数字 100 2001
netsh 结果到 PowerShell 对象

我正在尝试与NETSH https ss64 com nt netsh html来自 PowerShell 我想看到这个命令的结果例如一个对象但是netsh返回一个字符串 netsh wlan show hostednetwork Ge
Perl 正则表达式图灵完备吗？

我见过 Ruby 和 Perl 程序员做了一些事情复杂的代码挑战 https codegolf stackexchange com questions 3596 regex validating regex完全用正则表达式这前瞻和后瞻 h
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
MySQL正则表达式：如何将字符串中的数字与\d匹配？

我有一个专栏release date它以字符串格式存储日期不是 DATETIME 格式因为它们有时可以是任何其他字符串文字我想根据给定的月份和年份查找任意日期的所有记录尝试遵循但对我不起作用 gt Post find all con
这个巨大的正则表达式是如何工作的？

我最近在我的一个目录中的一个名为的文件中找到了下面的代码doc php 文件功能或链接到文件管理器做得非常好基本上它列出了当前目录中的所有文件并且允许您更改目录它可以访问我的所有文件添加重命名信息删除我不记得安装过它我
在 Python 2.7 中出现“ImportError：无法导入名称 HTTPSConnection”错误

我正在尝试在 AWS ElasticBeanstalk 中部署 django 当我按照所示步骤操作时here http docs aws amazon com elasticbeanstalk latest dg create deploy
java中删除字符串中的特殊字符？

如何删除字符串中除之外的特殊字符现在我用 replaceAll w s 它删除了所有特殊字符但我想保留谁能告诉我我该怎么办 Use replaceAll w s 我所做的是将下划线和连字符添加到正则表达式中我添加了一个连字符之前
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI

随机推荐

Flexbox 难以将图标与容器底部对齐

我在使用 Flexbox 时遇到了一些困难如你所见我有一个aside包含社交媒体图标的有序列表的元素由于某种原因我无法将这些图标粘在包含的内容的底部div HTML代码 div class outercontainer group
SQL 在每个 SELECT 请求上获取 ROW_NUMBER 和 COUNT

我正在构建一个网格机制我需要从数据库中检索找到的总数或记录的数据仅检索其中包含 row number 的这些记录的范围我正在使用 Sql Server 进行测试但我也需要在 Oracle 和 MySql 上支持它这就是我正在尝试的
Visual Studio 2013 中的 SQL Server 项目

我最近从 Visual Studio 2010 升级到 Visual Studio 2013 我的大多数项目都可以使用 VS2013 打开但 SQL Server 2008 数据库项目被列为不兼容除外 VS2013 项目模板不包含 S
JELLY_BEAN 及以下版本的 JavascriptInterface 注释

正如上面明确指出的官方文档 https developer android com reference android webkit WebView html addJavascriptInterface 28java lang Objec
PostgreSQL psql命令行显示bytea列

我有一个图像数据库图像表有两个bytea列我想查询该表并查看这些列以便能够了解这些条目是否存储图像因为它们是可为空的列目前当我使用 psql 命令行查询数据库时我的整个命令行屏幕会变成空白试图显示 bytea 我已经用谷歌搜
无法将“UITableViewCell”类型的值转换为“(AppName).(CustomCellName)”

我目前正在尝试使用 xCode 6 3 swift 1 2 创建自定义表格视图单元格由于某些原因在 cellforRowAtIndexPath 方法中我似乎无法设置我的单元格变量代码将编译但是当这行代码命中时 var cell M
Scala Sets 包含相同的元素，但 SameElements() 返回 false

在使用 Scala 进行工作时可迭代对象的练习 http scala exercises 47deg com koans iterables 我遇到了以下奇怪的行为 val xs Set 5 4 3 2 1 val ys Set 1 2 3
删除 node-role.kubernetes.io/master:NoSchedule 污点

我可以输入什么 CLI 命令来删除node role kubernetes io master NoSchedule来自 Kubernetes 集群中主节点的污染以下命令失败 lnxcfg ip 10 0 0 193 kubectl ta
如何计算2个node2vec模型之间的距离

我有 2 个不同时间戳的 node2vec 模型我想计算两个模型之间的距离两个模型具有相同的词汇我们更新模型我的模型是这样的 model1 1 0 1 0 5 2 0 3 0 4 3 0 2 0 5 model2 1 0 15 0
TCP网络数据包什么时候会在应用层产生分片？

TCP报文什么时候会在应用层分片当应用程序发送 TCP 数据包时应用程序层的接收者是否会收到两个或多个数据包中的数据包如果是这样什么条件会导致数据包被分割似乎数据包在达到以太网在网络层 1500 字节的限制之前不会被分段但是
Azure 容器实例和容器 Web 应用程序有什么区别？

我刚刚使用 Azure 多容器实例部署了一个 Web 应用程序 node js 容器和 mongo 容器它有点像 Docker Compose 但适用于 Azure 特定的 yaml 文件 https learn microsoft co
如何在其基类中创建子类对象？

class arijit public static void main String args System out println Base class main amit ab new amit how is it possible
如何将 ibOutlet 从子视图链接到故事板 xcode 中的自定义 UIView 类

我认为这张图片说明了一切我有一个 UIView 的子类我已将其输入到类字段中我正在尝试在故事板和类实现之间连接 ibOutlets 它没有给我错误但它也不起作用这是另一个 xcode bug 还是我期望它以一种不会的方式工作这是
docker-compose exec python 输入设备不是 AWS EC2 UserData 中的 TTY

我正在使用 EC2 UserData 来引导实例引导程序执行的跟踪日志 var log cloud init output log 我发现脚本停在 docker compose exec web python var www flask
使用 0 或 BIND_AUTO_CREATE 作为 bindService 的标志

通过参考bindService 意图服务 ServiceConnection conn int 标志 http developer android com reference android content Context html bin
是否可以使用 mailTo 保留签名？

例如如果我使用 mailto abc com body Hello All 则默认 Outlook 客户端中不会保留签名部分如果我从上面删除正文部分签名将被保留即使我在 mailTo 中使用正文有什么方法可以保留签名吗附我在这
Kafka 错误：SLF4J：对 [org.apache.kafka.common.Cluster] 类型的对象调用 toString() 失败

我尝试将 Gattle 与 Kafka 一起使用但经常出现此错误 01 32 53 933 kafka producer network thread producer 1 DEBUG o apache kafka clients Net
美国天气雷达数据源或 API？

美国是否有用于访问天气雷达数据的政府或私人 API NOAA 有一个 SOAP API http www nws noaa gov forecasts xml http www nws noaa gov forecasts xml 这里列出
Spring-MVC：什么是“上下文”和“命名空间”？

From XmlWeb应用程序上下文 http javasourcecode org html open source spring spring 3 0 4 org springframework web context support
Python中字符串中重复字符的正则表达式

我是正则表达式的新手我有一个正则表达式可以从字符串中删除重复字符 gt gt gt self repeat regexp re compile r w w 2 w gt gt gt self repl r 1 2 3 上面两行代码去掉了

Python中字符串中重复字符的正则表达式

Python中字符串中重复字符的正则表达式 的相关文章

随机推荐

热门标签

Python中字符串中重复字符的正则表达式的相关文章