在Python中使用正则表达式捕获所有连续的全大写单词？

2024-01-02

我正在尝试使用Python中的正则表达式来匹配所有连续的大写单词/短语。鉴于以下情况：

    text = "The following words are ALL CAPS. The following word is in CAPS."

代码将返回：

    ALL CAPS, CAPS

我目前正在使用：

    matches = re.findall('[A-Z\s]+', text, re.DOTALL)

但这返回：

    ['T', ' ', ' ', ' ', ' ALL CAPS', ' T', ' ', ' ', ' ', ' ', ' CAPS']

我显然不想要标点符号或“T”。我只想返回连续的单词或仅包含所有大写字母的单个单词。

Thanks

这个可以完成以下工作：

import re
text = "tHE following words aRe aLL CaPS. ThE following word Is in CAPS."
matches = re.findall(r"(\b(?:[A-Z]+[a-z]?[A-Z]*|[A-Z]*[a-z]?[A-Z]+)\b(?:\s+(?:[A-Z]+[a-z]?[A-Z]*|[A-Z]*[a-z]?[A-Z]+)\b)*)",text)
print matches

Output:

['tHE', 'aLL CaPS', 'ThE', 'Is', 'CAPS']

解释：

(           : start group 1
  \b        : word boundary
  (?:       : start non capture group
    [A-Z]+  : 1 or more capitals
    [a-z]?  : 0 or 1 small letter
    [A-Z]*  : 0 or more capitals
   |        : OR
    [A-Z]*  : 0 or more capitals
    [a-z]?  : 0 or 1 small letter
    [A-Z]+  : 1 or more capitals
  )         : end group
  \b        : word boundary
  (?:       : non capture group
    \s+     : 1 or more spaces
    (?:[A-Z]+[a-z]?[A-Z]*|[A-Z]*[a-z]?[A-Z]+) : same as above
    \b      : word boundary
  )*        : 0 or more time the non capture group
)           : end group 1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

在Python中使用正则表达式捕获所有连续的全大写单词？的相关文章

pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Java：正则表达式排除空值

在问题中here https stackoverflow com questions 51359056 java regexp for a separated group of digits 我得到了正则表达式来匹配 1 到 99 之间的一
Perl：正则表达式不抓取代码中的多行 C 风格注释

我有一个 Perl 程序读取用 C 编写的 SRC 文件使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名打开新的目标文件执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释注意这些注释
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
反向引用在 PHP 中不起作用

最近我一直在研究更多的是在实践中说实话正则表达式我注意到他的力量我提出的这个要求 link https stackoverflow com questions 30380397 take the text up to a speci
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
从字符串中获取数字

我有一个字符串例如 lorem 110 ipusm 我想获取 110 我已经尝试过这个 preg match all 0 9 string ret 但这正在返回 Array 0 gt 1 1 gt 1 2 gt 0 我想要这样的东西 Ar
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

如何让 Eclipse 自动生成新 Java 类的 main 方法？

有谁知道我的 Eclipse 不预加载的原因 public static void main String args 当我创建一个新课程时我该怎么做才能让它自动出现 Type main and press ctrl space The e
提取 Windows 中任何文件的缩略图

从任何文件而不仅仅是不同大小的图像中提取缩略图的最有效方法是什么我已经查看了所有内容其中最有希望的是 Windows API ShellFile 但它似乎没有正确安装我使用的是Windows 7 不久前我编写了一个 Thumbn
这些 Linux 内核 Oops 字段的含义是什么？

我在开发人员的生活中已经遇到过一些 Oops 虽然我熟悉可以从这些 Oops 中检索到的一些信息但仍然有一些信息我无法理解因此无法用来解决问题下面您将找到一个 Oops 示例我将描述我可以从中推断出什么然后我会问剩下的信息可以告
Django在syncdb时以自定义方式初始化数据库

我在开发过程中使用 Django 令人烦恼的是每次我对模型进行一点更改时我都需要删除数据库并运行syncdb 为了测试的目的我想每次运行syncdb时自动将一些初始数据添加到数据库中我尝试将这些代码放入一个应用程序中 init py
bash：如何在没有 date -d 选项的情况下比较 Solaris 上的两个日期

我试图将日志文件行中输入的日期与昨天的日期进行比较如果差异超过一天则它会打印日志文件中的该行日志档案 more ActiveX2Alarms log 2016 09 30 01 40 14 MET faultManager netwo
为什么我可以在私有类型上使用 auto？

我对以下代码的编译和运行感到惊讶 vc2012 gcc4 7 2 class Foo struct Bar int i public Bar Baz return Bar int main Foo f Foo Bar b f Baz err
如何将 Excel 配色方案从一个工作簿复制到另一个工作簿

有时当我从一个工作簿复制并粘贴到另一个工作簿时目标配色方案看起来很奇怪如何将配色方案从一个工作簿复制到另一个工作簿打开 VBA 并键入以下内容根据需要更改工作簿的名称 workbooks DestinationWorkbook x
获取手机中安装的所有社交媒体应用程序的列表？

我正在开发一个应用程序其中列出了用户移动设备中安装的所有应用程序我检索了所有应用程序并将其列出在回收视图现在我想将社交媒体应用程序从该列表中分离出来以用于其他目的有什么办法可以分离社交媒体应用程序吗我使用下面的代码从手机检索所有应
何时使用代替
？

正如问题所示如果我想在 HTML 中添加一些文本那么我应该何时使用 p 我什么时候应该使用 span 您应该记住 HTML 旨在描述它包含的内容所以如果你想传达一段话那就这么做吧不过您的比较并不完全正确更直接的比较是何时使
有没有办法用带参数的sql脚本运行impala shell？

有没有办法使用带参数的 SQL 脚本运行 impala shell 例如 impala shell f home john sql load sql dir1 dir2 dir3 data file 我收到错误错误无法解析参数 f ho
流浪者警告：连接被拒绝。重试

测试默认示例 vagrant init hashicorp precise32 vagrant up 我的盒子视窗8 1 虚拟盒 5 0 2 流浪者1 7 4 Intel i7 4700MQ CPU 似乎具有 Intel 虚拟化技术 VT
无法分配给引用或变量中的 Angular 产品构建错误

我无法构建我的角度应用程序的产品版本 IDE 控制台中只有此消息错误无法分配给引用或变量所以我只有添加这些选项才能构建 aot false buildOptimizer false 但是即使使用这些选项应用程序在部署后也会失败并在
如何直接使用适配器从 AutoCompleteTextView 中删除数据

I have AutoCompleteTextView which uses to search the value from database On Click of filtered value it s set to the Auto
Angular2 中 valueChanges 的空订阅

我有一个奇怪的情况如果留空订阅永远不会触发这不起作用 this formGroup get unitCount valueChanges do value gt console log value subscribe 当这工作正常时
如何调用无状态小部件的重建？

Context 我有两个无状态小部件页面 HomePage and DetailsPage 显然应用程序启动并启动HomePage 用户可以按下一个按钮来导航到DetailsPage with a Navigator pop 按钮导航回到
在 QGraphicsScene 中移动 QGraphicItems 的有效方法

我正在使用 pyqt5 开发视频播放器我在场景中使用 QGraphicsVideoItem 在此视频项目之上我还需要一些在每个新帧上围绕场景移动的多边形他们跟踪视频中的内容理想情况下我不想让它们以 30 fps 的速度移动我进行了
如何将 hibernate-validator 4.3.0.Final 升级到 Glassfish 3.1.2？

目前 Hibernate Validator 已发布最新版本为 4 3 0 Finalhere http bit ly KPJvw9 我尝试按照以下步骤将其升级到 Glassfish 3 1 2 1 Remove the GLASSFISH
如何在 Bootstrap 3.3.7 中强制使用汉堡菜单，即使是桌面版？

我的代码看起来与此页面相同 https getbootstrap com docs 3 3 examples navbar https getbootstrap com docs 3 3 examples navbar 当我在手机上打开页面
如何使用IAM角色通过临时凭证访问资源？

我使用的 AWS IAM 角色允许实例使用临时 API 凭证访问密钥密钥和安全令牌访问某些资源当我使用此 ruby 脚本测试临时凭据时它运行没有任何问题 require rubygems require aws sdk AWS c
在Python中使用正则表达式捕获所有连续的全大写单词？

我正在尝试使用Python中的正则表达式来匹配所有连续的大写单词短语鉴于以下情况 text The following words are ALL CAPS The following word is in CAPS 代码将返回 ALL

在Python中使用正则表达式捕获所有连续的全大写单词？

在Python中使用正则表达式捕获所有连续的全大写单词？ 的相关文章

随机推荐

热门标签

在Python中使用正则表达式捕获所有连续的全大写单词？的相关文章