如何使用 re 查找连续、重复的字符

2024-03-06

我想找到字符串中所有连续的、重复的字符块。例如,请考虑以下情况:

s = r'http://www.google.com/search=ooo-jjj'

我想找到这个:www, ooo and jjj.

我尝试这样做:

m = re.search(r'(\w)\1\1', s)

但它似乎并没有像我预期的那样工作。有任何想法吗?

另外,我怎样才能在 Bash 中做到这一点?


((\w)\2{2,})匹配 3 个或更多连续字符:

In [71]: import re
In [72]: s = r'http://www.google.com/search=ooo-jjjj'
In [73]: re.findall(r'((\w)\2{2,})', s)
Out[73]: [('www', 'w'), ('ooo', 'o'), ('jjjj', 'j')]

In [78]: [match[0] for match in re.findall(r'((\w)\2{2,})', s)]
Out[78]: ['www', 'ooo', 'jjjj']

(\w)匹配任何字母数字字符。

((\w)\2)匹配任何字母数字字符后跟相同的字符,因为\2匹配组号 2 的内容。 由于我嵌套了括号,组号 2 指的是匹配的字符\w.

然后把它们全部放在一起,((\w)\2{2,})匹配任何字母数字字符,后跟重复的相同字符额外2次或以上.

总的来说,这意味着正则表达式要求字符重复 3 次或更多次。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 re 查找连续、重复的字符 的相关文章

随机推荐

  • 使用C#正则表达式删除HTML标签

    如何使用 C 正则表达式替换 删除所有 HTML 标记 包括尖括号 有人可以帮我解决代码吗 正如前面经常提到的 不应使用正则表达式来处理 XML 或 HTML 文档 它们在处理 HTML 和 XML 文档时表现不佳 因为无法以通用方式表达嵌
  • 相当于 VB.NET 中的 MoveNext

    由于 Recordset MoveNext 函数在 VB NET 中不再可用 在互联网上搜索了很多 我想要一种方法来解决我的问题 使用 MSSQL 刚刚在 SQLDATASET 不支持的地方看到 movenext 函数 我想使用类似于 Mo
  • 当我在线加载页面时,“web.config”文件出错

    我是 ASP NET 4 0 的新手开发人员 我开发了一个网站 它完全可以在我的本地系统中运行 但是现在我将所有文件上传到服务器 当我加载任何页面时 会出现错误网页配置 file 我的 Web Config 代码是这样的
  • Xcode 3.1.4 缺少代码签名权利选项?

    我使用的是 Xcode 3 1 4 并遇到了可怕的 可执行文件已使用无效权利签名 错误 我正在尝试在 BUILD 选项中添加 Entitlement plist 但我找不到放置它的位置 该选项曾经存在于 代码签名身份 之上 我认为它被称为
  • 用于网站流媒体的免费音频播放器

    我可以在我的网站中使用免费的音频播放器吗 它们可以定制吗 我听说过 Soundmanager 2 它是一个基于 Flash 的播放器 带有 JavaScript 前端 还有其他类似的免费播放器吗 如果您想要不需要加载 Flash 插件的东西
  • 何时以及为什么应该在 Scala 中使用 Applicative Functors

    我知道Monad在Scala中可以表示如下 trait Monad F def flatMap A B f A gt F B F A gt F B 我明白为什么它很有用了 例如 给定两个函数 getUserById userId Int O
  • 如何在 .NET 中表示一个非常大的整数?

    NET 是否提供了能够表示极大整数 例如 100 阶乘 的类 如果没有 有哪些好的第三方库可以实现这一点 NET 4 有一个大整数 http msdn microsoft com en us library system numerics
  • asp.net 添加 ApiController 作为依赖注入的服务

    你好 我走了本指南 http scottdorman github io 2016 03 17 integrating asp net core dependency injection in mvc 4 将 asp net core 依赖
  • 使用类先验优化输入图像

    我正在尝试实现谷歌博客条目的第一部分起始论 深入探讨神经网络 https research googleblog com 2015 06 inceptionism going deeper into neural html在 TensorF
  • 符号链接检查 - Linux Bash 脚本

    我正在尝试创建一个脚本来搜索目录以查找指向不存在对象的符号链接 我的目录中有一个文件 其中的符号链接已删除 但由于某种原因 当我运行下面的脚本时 它说文件存在 bin bash ls l 1 if d 1 then while read f
  • MySQL 查询将值与前一行的值进行比较

    我一直在寻找 但一直无法找到解决方案 我知道这是可行的 但我只是还没有我需要的忍者 SQL 技能 我正在寻找此问题的解决方案 我有两个与股市数据相关的表 第一个是带有 ID 和股票代码 ID SYMBOL 的简单股票代码列表 第二个表包含每
  • JavaScript 样式/优化:String.indexOf() v. Regex.test()

    我最近遇到了这段 JavaScript 代码 if gt lt lt gt indexOf sCompOp 1 我很感兴趣 因为要编写这个测试 我会这样做 if gt lt lt gt test sCompOp 这只是风格上的差异 还是其他
  • 从对象数组中获取属性值数组

    有一个类叫Employee class Employee var id Int var firstName String var lastName String var dateOfBirth NSDate init id Int firs
  • iOS 拦截我的应用程序的所有网络流量?

    我想为来自我的应用程序的所有网络调用添加代理 就像是 func intercept request URLRequest if isOk request return the request continues as normally el
  • MySQL 错误:无法加载身份验证插件“caching_sha2_password”

    我刚刚在 macOS v10 13 4 上使用 Homebrew 安装了 MySQL Ver 14 14 Distrib 5 7 22 我运行了命令 brew install mysql 安装完成后 按照 Homebrew 的指示 我运行了
  • 通用列表的标准差? [复制]

    这个问题在这里已经有答案了 我需要计算通用列表的标准差 我会尝试包含我的代码 它是一个包含数据的通用列表 数据主要是浮点数和整数 这是我的代码 与其相关 但没有详细介绍 namespace ValveTesterInterface publ
  • 如何检查父元素中的点击,而不是子元素中的点击?

    Code HTML div class parent div class child div div JavaScript snip function parent click function alert This dialog shou
  • 在图表中显示统计上显着的差异

    我进行了六次处理的实验 每次处理都是在光明和黑暗中进行的 我使用 ggplot2 制作条形图 我想在图表中添加显着性字母 例如 LSD 结果 以显示每种治疗的光和暗之间的差异 但这给了我一个错误 有什么建议吗 data lt read ta
  • Python - 尝试使用 numpy.mean 时“无法使用灵活类型执行缩减”

    当我尝试计算列的平均值时 我一直处于无计可施的状态 因为我不断收到 无法使用灵活类型执行减少 文件读取得很好 任何行 列中都没有缺失值 但是当我放入行中 Brain wt mean np mean ifile axis 0 那么Python
  • 如何使用 re 查找连续、重复的字符

    我想找到字符串中所有连续的 重复的字符块 例如 请考虑以下情况 s r http www google com search ooo jjj 我想找到这个 www ooo and jjj 我尝试这样做 m re search r w 1 1