匹配正则表达式的所有单词列表

2023-11-24

假设我有一些字符串:“Lorem ipsum dolor sat amet” 我需要一个长度超过 3 的所有单词的列表。我可以使用正则表达式来完成吗?

e.g.

pattern = re.compile(r'some pattern')
result = pattern.search('Lorem ipsum dolor sit amet').groups()

结果包含“Lorem”、“ipsum”、“dolor”和“amet”。

EDITED:

我的意思是单词只能包含字母和数字。


>>> import re
>>> myre = re.compile(r"\w{4,}")
>>> myre.findall('Lorem, ipsum! dolor sit? amet...')
['Lorem', 'ipsum', 'dolor', 'amet']

请注意,在 Python 3 中,所有字符串都是 Unicode,这也会查找使用非 ASCII 字母的单词:

>>> import re
>>> myre = re.compile(r"\w{4,}")
>>> myre.findall('Lorem, ipsum! dolör sit? amet...')
['Lorem', 'ipsum', 'dolör', 'amet']

在Python 2中,你必须使用

>>> myre = re.compile(r"\w{4,}", re.UNICODE)
>>> myre.findall(u'Lorem, ipsum! dolör sit? amet...')
[u'Lorem', u'ipsum', u'dol\xf6r', u'amet']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

匹配正则表达式的所有单词列表 的相关文章

随机推荐

  • 在 sphinx 文档中包含独立的 HTML 页面

    对于我的项目的大部分文档 我更喜欢标准的 sphinx 布局 然而 对于登陆页面 我更喜欢使用自定义 HTML CSS JS 而不使用普通 sphinx 网站的任何布局 目录或侧边栏 有没有一种方法可以在 sphinx 生成的网站中包含原始
  • 自定义属性未在样式和主题内解析

    我有一个带有自定义主题的 Android 应用程序 该应用程序是 2 3 年前开发的 我有这个风格attr xml资源文件
  • 如何在同一端口 4200 上运行 Angular 4 应用程序和 NodeJS api 以进行生产和开发?

    我已经创建了 Angular 4 应用程序 我可以使用它来运行它ng serve open它运行在localhost 4200 我想要的是我还使用创建了 apinodejs现在在同一个角度项目中我想运行该 APIlocalhost 4200
  • 这个 128 位整数乘法在汇编 (x86-64) 中如何工作?

    我正在阅读计算机系统 程序员的视角作业是描述这个算法是如何工作的 C函数 void store prod int128 dest int64 t x int64 t y dest x int128 y 集会 movq rdx rax cqt
  • 如何写下 rspec 来测试救援块?

    我有这样的方法 def className def method name some code rescue some code and error message end end 那么 如何写下 rspec 来测试救援块 如果你想拯救 就
  • 从 WaitHandle.Wait 构造任务

    我选择返回Task
  • CodeIgniter - 如何检查每种方法使用的会话

    假设我的控制器名为Book 我有很多方法 比如get book read book remove book 如果没有用户登录 则无法使用类中的任何方法 我可以获得user id来自会话 我的问题是 检查是否存在的最佳方法是什么user id
  • 在 Scala 中,如何从可序列化的类型创建 TypeTag? [复制]

    这个问题在这里已经有答案了 在 Scala 反射中 通常可以使用 TypeCreator 从 Type 构造 TypeTag object TypeUtils import ScalaReflection universe def crea
  • Slim 3在中间件中获取当前路由

    我想在中间件类中获取当前 I 路由的名称 以前 在 Slim 2 中 您可以像这样获取当前路线 route this gt app gt router gt getCurrentRoute 但这个功能在Slim 3 0版本中已经被删除了 我
  • 如何尝试多个 SELECT 直到获得结果?

    如果我想以递减精度搜索表中的单行 例如像这样 SELECT FROM image WHERE name LIKE text AND group id 10 LIMIT 1 当这没有给我结果时 尝试这个 SELECT FROM image W
  • C++ 字符串排序像人类一样吗?

    我想按照人类对字母数字字符串进行排序的方式对其进行排序 即 A2 位于 A10 之前 a 当然位于 Z 之前 有没有什么方法可以不写迷你解析器 理想情况下 它还会将 A1B1 放在 A1B10 之前 我看到问题了 Microsoft SQL
  • 如何将一个数据帧映射到另一个数据帧(python pandas)?

    给定这两个数据帧 如何获得预期的输出数据帧 长的方法是循环遍历数据帧的行iloc然后使用map转换后的函数df2 to a dict将 x 和 y 映射到它们的分数 这看起来很乏味 并且在大型数据帧上运行需要很长时间 我希望有一个更清洁的解
  • 使用 python 验证 SSL 中的对等点

    我试图找出如何通过 python 中的服务器验证自签名证书 我在谷歌上找不到太多数据 我还想确保服务器网址 预先感谢您的任何见解 从我的第一个回复的评论中 我发现人们普遍误解了 验证证书的含义 我会尝试在这里写一个简短的解释 以消除一些幻想
  • JSON 中的根节点

    我的任务是定义两个网络应用程序之间的通信 我决定为此使用 JSON JSON 中具有根节点的情况有多常见 假设我们有一个汽车对象 这是以 Car 为根节点的 JSON Car Make Mustang YearBuilt 1999 现在假设
  • JVM 如何开始寻找类?

    我很好奇 JVM 寻找执行程序的所有位置 我更感兴趣的是了解 JVM 查找类文件的顺序和位置 例如它是否查找 java 库 扩展库 类路径等任何目录 例如调用 java 的当前目录 我对 JVM 行为更感兴趣 而不是类加载器如何加载类 我知
  • 如何缩放图片框中的某个点

    这是我的代码 我可以缩放图片框 但不能在某一点缩放 旋转鼠标滚轮时如何缩放到鼠标点 变量是 private double m dZoomscale 1 0 THIS IS THE ZOOM SCALE TO WHICH EACH OBJEC
  • SQLite 数据库文件支持的最大表数

    即使读完之后SQLite 限制我找不到最大表数一个SQLite数据库文件可以容纳 所以 我想知道是否 SQLite数据库可以容纳的最大表数有限制吗 SQLite 数据库文件中包含数千个小表是一个问题吗 SQLite 数据库文件中的许多表会影
  • 将 github 个人访问令牌与 TortoiseSVN 结合使用

    Github 下个月将关闭密码访问 因此我生成了个人访问令牌 PAT 然后 我尝试使用以下 URL 查看现有存储库的新副本 https 我 电子邮件受保护 我 myrepo git 其中 ghp blahblahblah 是我的 PAT 我
  • 从查询中获取表架构

    As per MSDN SqlDataReader GetSchemaTable返回所执行查询的列元数据 我想知道是否有类似的方法可以为给定的查询提供表元数据 我的意思是涉及哪些表以及它有哪些别名 在我的应用程序中 我收到查询 并且需要附加
  • 匹配正则表达式的所有单词列表

    假设我有一些字符串 Lorem ipsum dolor sat amet 我需要一个长度超过 3 的所有单词的列表 我可以使用正则表达式来完成吗 e g pattern re compile r some pattern result pa