正则表达式仅提取字母数字单词

2024-02-02

我正在寻找一个正则表达式来提取仅包含字母数字字符的单词：

string = 'This is a $dollar sign !!'
matches = re.findall(regex, string)
matches = ['This', 'is', 'sign']

这可以通过对字符串进行标记并使用以下正则表达式单独评估每个标记来完成：

^[a-zA-Z0-9]+$

由于性能问题，我希望能够提取字母数字标记而不标记整个字符串。我最接近的是

regex = \b[a-zA-Z0-9]+\b

，但它仍然提取包含字母数字字符的子字符串：

string = 'This is a $dollar sign !!'
matches = re.findall(regex, string)
matches = ['This', 'is', 'dollar', 'sign']

有正则表达式可以解决这个问题吗？我尝试过不同的方法，但无法找到解决方案。

不是单词边界，而是向后查找和向前查找空格（或字符串的开头/结尾）：

(?:^|(?<= ))[a-zA-Z0-9]+(?= |$)

https://regex101.com/r/TZ7q1c/1 https://regex101.com/r/TZ7q1c/1

请注意，“a”是一个独立的字母数字单词，因此它也包含在内。

['This', 'is', 'a', 'sign']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

alphanumeric

正则表达式仅提取字母数字单词的相关文章

如果 Excel 文件是由程序创建的，Pandas read_excel 对于具有简单公式的单元格返回 nan [重复]

这个问题在这里已经有答案了 I use pd read excel读取由以下命令创建的 excel 文件openpyxl并从一个网址下载解析后的数据框将给出nan如果单元格值是公式 which formula is simply 100
Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
在linux上安装python ssl模块，无需重新编译

是否可以在已经安装了 OpenSSL 的 Linux 机器上安装 python 的 SSL 模块而无需重新编译 python 我希望它就像复制几个文件并将它们包含在库路径中一样简单 Python版本是2 4 3 谢谢是否可以在已经安装了
用 Python 绘制直方图

我有两个列表 x 和 y x 包含字母表 A Z Y 包含它们在文件中的频率我尝试研究如何在直方图中绘制这些值但在理解如何绘制它方面没有成功 n bins patches plt hist x 26 normed 1 facecolor
Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下 Unicode 转换为 ASCII u ABRA xc3O JOS xc9 I tried encode and decode他们不会这么做有人有建议吗 Unicode 字符u xce0 and u xc
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
使用正则表达式搜索 Ruby 数组

你好我有一个小的 ruby 函数它可以分割出一个 Ruby 数组如下所示 def rearrange arr from to sidx arr index from eidx arr index to arr sidx arr sid
python Recipe：列出最接近等于值的项[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案考虑像这样的列表 0 3 7 10 12 15 19 21 我想获得最接近任何值的最近的最小数字所以如果我通过4 我会得到3 如果我
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
根据特定字符获取整个字符串或子字符串

我有一个包含 MIME 类型的字符串例如application json 现在我想将其与实际的 HTTP 标头进行比较在本例中content type 如果标头包含 MIME 类型那么就很简单 if mimeType contentT
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
使用 pandas 单元格中列表的长度选择行[重复]

这个问题在这里已经有答案了我有一张表 df a b c 1 x y x 2 x z c d 3 x t e f g 只是想知道如何使用 c 列的长度选择行 such as df loc len df c gt 1 我知道这是不对的正确的
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error

随机推荐

将文件从 iPhone 沙箱复制到桌面？

我正在为uni开发一个iPhone应用程序我们在iPhone的沙箱目录中创建一个sqlite数据库文件我们的应用程序在内部写入此文件我想知道如何将此文件返回到我的桌面我真的不介意如何做到这一点任何方式都可以也许甚至可以做一些事情
RSpec 1.3.3 Rails 2.3.9 Webrat 0.7.3“未定义方法‘分配’”

My spec require spec helper describe user sessions new html erb do let user session mock model UserSession as null objec
是否有用于解析 Windows 注册表文件的纯 Python 库？

是否有一个纯Python 即完全跨平台库用于解析Windows注册表文件 NTUSER DAT 只读访问是可以接受的如果没有存在哪些资源来记录注册表文件的逆向工程结构 Thanks Update由于在提出这个问题时似乎不存在纯 Pyt
Windows 8 下不会调用 NDIS 筛选器驱动程序的 FilterAttach 例程

大家我将著名的数据包捕获软件 WinPcap 从 NDIS 5 协议移植到 NDIS 6 LWF Win7下一切正常然而在Win8下 FilterAttach例程永远不会被调用我发现DriverEntry中的NdisFRegiste
JQuery隐藏不删除对象的空间？

我正在使用一些 jQuery 代码来隐藏列表项 ul items each function li gt 4 this hide 我的问题是 hide似乎隐藏了该元素但它的空间仍然被分配有没有办法删除这个空间比如display non
更改pdfptable的字体大小

如何设置 pdfptable 的字体创建短语时必须在每个单元格中设置字体 Dim yourFont As BaseFont BaseFont CreateFont Current Server MapPath fonts somefon
使用 swift 进行 google adwords 转化跟踪

我正在尝试让 google adwords 参与我关注的一个快速项目https developers google com app conversion tracking ios https developers google com ap
如何给导航栏上的backButtonItem设置action？

如何给导航栏上的backButtonItem设置action 我有一个导航栏当我按下后退按钮时我需要向用户提醒一些消息并且只有在用户做出反应后才返回到上一个视图我该怎么做谢谢 void viewDidLoad super view
如何在Python中模拟cx_Oracle游标

我在一个类中有两个以下函数我需要模拟数据库连接和游标结果 cx Oracle connect 已成功修补它按预期工作但是光标 callfunc fetch all 不会被模拟知道正确的语法是什么吗 class dbconnect d
如何使用 JsonSerialized::jsonSerialize() 忽略 null 属性？

假设我们有一个简单的对象可以使用嵌套对象进行序列化 class User implements JsonSerializable private name private email private address public funct
如何从 Oracle 日期获取 UNIX 纪元？ [复制]

这个问题在这里已经有答案了有没有人有比这更好更快的解决方案来使用 Oracle SQL 获取 unix 纪元时间戳 SQL gt select cast sysdate as date cast to date 1970 01 01 YY
从图像中删除标签

我有一张带有 2 个标签的映像在 AWS ECR 中我只想删除一个标签我可以使用以下命令轻松地从本地环境中删除 docker rmi
是否可以通过Google Places API获取“流行时代”信息

是否可以通过 Google Places API 或任何其他 API 获取流行时间信息我需要在我的应用程序中针对特定位置显示此信息这是 Google 问题跟踪器中最重要的功能请求之一超过 500 颗星 https issuetra
如果两行中满足某些条件，如何在 R 数据框中添加新列，显示当前行和前一行中的值之和？

假设您有一个包含 a 和 b 列的数据框其值如下所示由以下命令生成df lt data frame a c 0 1 2 2 3 b c 1 3 8 9 4 假设您要添加列 c 如果 a 中的值等于列 a 中紧邻前一行的值则对列 b 中
Django Rest Framework - 如何路由到函数视图

我在用Django with Django Rest Framework Django 2 0 2 djangorestframework 3 7 7 我正在尝试路由到function view 我当前的设置如下所示 project pro
您能否链接到使用BackgroundWorker 的一个很好的示例，而不将其作为组件放置在表单上？

我记得很多年前 2005年我在代码中使用了BackgroundWorker 但没有使用可视化组件但我不记得是如何使用的不幸的是我很健忘在停止使用它后很快就忘记了一切也许我正在扩展BackgroundWorker 类您能链接到以
在哪里可以查看 Web 部署历史记录？

我正在管理一家第三方供应商该供应商使用 Microsoft Web Deploy 将 ASP NET 网站推送到我们的服务器我可以在哪里找到文件发布地点时间的历史记录吗根据微软文档 http www iis net learn pu
在 Google Dataflow 中使用 FireStore

我想在带有 python 的数据流模板中使用 FireStore 我做过这样的事情 with beam Pipeline options options as p p Read from PubSub gt gt beam io ReadF
迭代单个左值

我想将一个左值传递给一个需要一对迭代器的函数并且让它的行为就像我将一对迭代器传递给仅包含该值的范围一样我的做法如下 include
正则表达式仅提取字母数字单词

我正在寻找一个正则表达式来提取仅包含字母数字字符的单词 string This is a dollar sign matches re findall regex string matches This is sign 这可以通过对字符串进

正则表达式仅提取字母数字单词

正则表达式仅提取字母数字单词 的相关文章

随机推荐

热门标签

正则表达式仅提取字母数字单词的相关文章