匹配正则表达式的所有单词列表

2023-11-24

假设我有一些字符串：“Lorem ipsum dolor sat amet” 我需要一个长度超过 3 的所有单词的列表。我可以使用正则表达式来完成吗？

e.g.

pattern = re.compile(r'some pattern')
result = pattern.search('Lorem ipsum dolor sit amet').groups()

结果包含“Lorem”、“ipsum”、“dolor”和“amet”。

EDITED:

我的意思是单词只能包含字母和数字。

>>> import re
>>> myre = re.compile(r"\w{4,}")
>>> myre.findall('Lorem, ipsum! dolor sit? amet...')
['Lorem', 'ipsum', 'dolor', 'amet']

请注意，在 Python 3 中，所有字符串都是 Unicode，这也会查找使用非 ASCII 字母的单词：

>>> import re
>>> myre = re.compile(r"\w{4,}")
>>> myre.findall('Lorem, ipsum! dolör sit? amet...')
['Lorem', 'ipsum', 'dolör', 'amet']

在Python 2中，你必须使用

>>> myre = re.compile(r"\w{4,}", re.UNICODE)
>>> myre.findall(u'Lorem, ipsum! dolör sit? amet...')
[u'Lorem', u'ipsum', u'dol\xf6r', u'amet']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

匹配正则表达式的所有单词列表的相关文章

如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
Python sqlite3参数化删除表

我在 python 中删除 sqlite3 表时遇到问题我正在使用标准sqlite3模块 self conn sqlite3 connect sql drop table self conn execute sql u table nam
Python grpc protobuf 存根生成问题：--grpc_out: protoc-gen-grpc: 插件失败，状态代码 1

正如问题所说我从源代码编译了 grpc 并且也做了sudo pip install grpcio 但是那which grpc python plugin不返回任何内容这是一个问题因为route guide的grpc python示例
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
Flask 中的 import 和 extends 有什么区别？

我正在阅读 Flask Web 开发在例4 3中 extends base html import bootstrap wtf html as wtf 我想知道 extends 和 import 有什么区别我认为它们在用法上很相似在什
使用 3d 对象作为 3d 散点图中的标记 - Python

使用下面的代码我尝试模拟一个用罐头制成的碗我希望每个标记都是一个罐头最好的方法是什么我真的很感激任何建议谢谢 import pylab import numpy as np from math import pi sin cos
python：是否有用于对输入流进行分块的库函数？

我想对输入流进行分块以进行批处理给定一个输入列表或生成器 x in 1 2 3 4 5 6 我想要一个能够返回该输入块的函数说如果chunk size 4 then x chunked 1 2 3 4 5 6 这是我一遍又一遍地做的事
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
Python，多线程，获取网页，下载网页

我想在一个站点批量下载网页我的 urls txt 文件中有 5000000 个 url 链接大约有300M 如何让多线程链接这些网址并下载这些网页或者如何批量下载这些网页我的想法 with open urls txt r as f
如何绘制多类分类器的精度和召回率？

我正在使用 scikit learn 我想绘制精度和召回曲线我正在使用的分类器是RandomForestClassifier scikit learn 文档中的所有资源都使用二元分类另外我可以绘制多类的 ROC 曲线吗另外我只找到
如何修改 contenteditable 元素的innerHTML

我使用 Selenium 与 Chrome driver 和 python3 6 来测试网站我在网页中有代码片段如下 div class 3F6QL 2WovP div class 39LWd Type a message div div
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137
Scrapy的redirect_urls异常.KeyError

我是 Scrapy 和 Python 的新手最近推出了我的第一个蜘蛛有一个功能似乎以前有效但现在它只适用于我试图废弃的一些网站代码行是 item url direct response request meta redirect u
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
Flask 扩展未在 app.extensions 中注册

我想访问在我的 Flask 应用程序上注册的一些扩展我尝试使用app extensions 但我初始化的一些扩展不在字典中 from flask import current app current app extensions get
VSCode无法切换matplotlib后端：ImportError：无法加载需要“qt5”交互框架的后端“Qt5Agg”

我只想通过在 VSCode 中运行 Python 来进行绘图但结果失败了我无法将后端从 agg 切换到 Qt5Agg 但是我可以在 VSCode 的终端中轻松执行此操作 VSCode集成终端中的问题如下所示我尝试了各种解决方案但失败

随机推荐

在 sphinx 文档中包含独立的 HTML 页面

对于我的项目的大部分文档我更喜欢标准的 sphinx 布局然而对于登陆页面我更喜欢使用自定义 HTML CSS JS 而不使用普通 sphinx 网站的任何布局目录或侧边栏有没有一种方法可以在 sphinx 生成的网站中包含原始
自定义属性未在样式和主题内解析

我有一个带有自定义主题的 Android 应用程序该应用程序是 2 3 年前开发的我有这个风格attr xml资源文件
如何在同一端口 4200 上运行 Angular 4 应用程序和 NodeJS api 以进行生产和开发？

我已经创建了 Angular 4 应用程序我可以使用它来运行它ng serve open它运行在localhost 4200 我想要的是我还使用创建了 apinodejs现在在同一个角度项目中我想运行该 APIlocalhost 4200
这个 128 位整数乘法在汇编 (x86-64) 中如何工作？

我正在阅读计算机系统程序员的视角作业是描述这个算法是如何工作的 C函数 void store prod int128 dest int64 t x int64 t y dest x int128 y 集会 movq rdx rax cqt
如何写下 rspec 来测试救援块？

我有这样的方法 def className def method name some code rescue some code and error message end end 那么如何写下 rspec 来测试救援块如果你想拯救就
从 WaitHandle.Wait 构造任务

我选择返回Task
CodeIgniter - 如何检查每种方法使用的会话

假设我的控制器名为Book 我有很多方法比如get book read book remove book 如果没有用户登录则无法使用类中的任何方法我可以获得user id来自会话我的问题是检查是否存在的最佳方法是什么user id
在 Scala 中，如何从可序列化的类型创建 TypeTag？ [复制]

这个问题在这里已经有答案了在 Scala 反射中通常可以使用 TypeCreator 从 Type 构造 TypeTag object TypeUtils import ScalaReflection universe def crea
Slim 3在中间件中获取当前路由

我想在中间件类中获取当前 I 路由的名称以前在 Slim 2 中您可以像这样获取当前路线 route this gt app gt router gt getCurrentRoute 但这个功能在Slim 3 0版本中已经被删除了我
如何尝试多个 SELECT 直到获得结果？

如果我想以递减精度搜索表中的单行例如像这样 SELECT FROM image WHERE name LIKE text AND group id 10 LIMIT 1 当这没有给我结果时尝试这个 SELECT FROM image W
C++ 字符串排序像人类一样吗？

我想按照人类对字母数字字符串进行排序的方式对其进行排序即 A2 位于 A10 之前 a 当然位于 Z 之前有没有什么方法可以不写迷你解析器理想情况下它还会将 A1B1 放在 A1B10 之前我看到问题了 Microsoft SQL
如何将一个数据帧映射到另一个数据帧（python pandas）？

给定这两个数据帧如何获得预期的输出数据帧长的方法是循环遍历数据帧的行iloc然后使用map转换后的函数df2 to a dict将 x 和 y 映射到它们的分数这看起来很乏味并且在大型数据帧上运行需要很长时间我希望有一个更清洁的解
使用 python 验证 SSL 中的对等点

我试图找出如何通过 python 中的服务器验证自签名证书我在谷歌上找不到太多数据我还想确保服务器网址预先感谢您的任何见解从我的第一个回复的评论中我发现人们普遍误解了验证证书的含义我会尝试在这里写一个简短的解释以消除一些幻想
JSON 中的根节点

我的任务是定义两个网络应用程序之间的通信我决定为此使用 JSON JSON 中具有根节点的情况有多常见假设我们有一个汽车对象这是以 Car 为根节点的 JSON Car Make Mustang YearBuilt 1999 现在假设
JVM 如何开始寻找类？

我很好奇 JVM 寻找执行程序的所有位置我更感兴趣的是了解 JVM 查找类文件的顺序和位置例如它是否查找 java 库扩展库类路径等任何目录例如调用 java 的当前目录我对 JVM 行为更感兴趣而不是类加载器如何加载类我知
如何缩放图片框中的某个点

这是我的代码我可以缩放图片框但不能在某一点缩放旋转鼠标滚轮时如何缩放到鼠标点变量是 private double m dZoomscale 1 0 THIS IS THE ZOOM SCALE TO WHICH EACH OBJEC
SQLite 数据库文件支持的最大表数

即使读完之后SQLite 限制我找不到最大表数一个SQLite数据库文件可以容纳所以我想知道是否 SQLite数据库可以容纳的最大表数有限制吗 SQLite 数据库文件中包含数千个小表是一个问题吗 SQLite 数据库文件中的许多表会影
将 github 个人访问令牌与 TortoiseSVN 结合使用

Github 下个月将关闭密码访问因此我生成了个人访问令牌 PAT 然后我尝试使用以下 URL 查看现有存储库的新副本 https 我电子邮件受保护我 myrepo git 其中 ghp blahblahblah 是我的 PAT 我
从查询中获取表架构

As per MSDN SqlDataReader GetSchemaTable返回所执行查询的列元数据我想知道是否有类似的方法可以为给定的查询提供表元数据我的意思是涉及哪些表以及它有哪些别名在我的应用程序中我收到查询并且需要附加
匹配正则表达式的所有单词列表

假设我有一些字符串 Lorem ipsum dolor sat amet 我需要一个长度超过 3 的所有单词的列表我可以使用正则表达式来完成吗 e g pattern re compile r some pattern result pa

匹配正则表达式的所有单词列表

匹配正则表达式的所有单词列表 的相关文章

随机推荐

热门标签

匹配正则表达式的所有单词列表的相关文章