javascript 正则表达式匹配任何脚本中所有非单词字符的正确正则表达式范围是什么？

2023-12-27

在 python 或 PHP 中，一个简单的正则表达式，例如/\W/gu匹配任何脚本中的任何非单词字符，但在 javascript 中它匹配[^A-Za-z0-9_]，与 python 和 PHP 匹配相同字符的正确范围是多少？

https://regex101.com/r/yhNF8U/1/ https://regex101.com/r/yhNF8U/1/

通用解决方案

Mathias Bynens 建议遵循UTS18 http://unicode.org/reports/tr18/#word推荐，从而实现 Unicode 感知\W看起来像：

[^\p{Alphabetic}\p{Mark}\p{Decimal_Number}\p{Connector_Punctuation}\p{Join_Control}]

请注意建议的 Unicode 属性类组合的注释：

这只是字边界的近似值（参见b http://unicode.org/reports/tr18/#b以下）。这为编程语言添加了连接器标点符号标识符，从而添加“_”和类似的字符。

更多注意事项

The \w构造（因此它的\W当在 Unicode 感知上下文中匹配时，在正则表达式引擎中匹配相似但有些不同的字符集。

例如，这里是非单词字符：\W https://learn.microsoft.com/en-us/dotnet/standard/base-types/character-classes-in-regular-expressions#non-word-character-w.NET 定义：[^\p{Ll}\p{Lu}\p{Lt}\p{Lo}\p{Nd}\p{Mn}\p{Pc}\p{Lm}], where \p{Ll}\p{Lu}\p{Lt}\p{Lo}可以收缩到纯粹\p{L}因此该模式等于[^\p{L}\p{Nd}\p{Mn}\p{Pc}].

在 Android 中（请参阅文档 https://developer.android.com/reference/java/util/regex/Pattern#unicode-support), [^\p{Alpha}\p{gc=Mn}\p{gc=Me}\p{gc=Mc}\p{Digit}\p{gc=Pc}\p{IsJoin_Control}], where \p{gc=Mn}\p{gc=Me}\p{gc=Mc}可以写成\p{M}.

在 PHP PCRE 中，\W火柴[^\p{L}\p{N}_].

Reexegg 备忘单 https://www.rexegg.com/regex-quickstart.html#classes定义Python 3\w as "Unicode 字母、表意文字、数字或下划线", i.e. [\p{L}\p{Mn}\p{Nd}_].

你可以大致分解一下\W as [^\p{L}\p{N}\p{M}\p{Pc}]:

/[^\p{L}\p{N}\p{M}\p{Pc}]/gu

where

[^ - is the start of the negated character class that matches a single char other than:
- \p{L}- 任何 Unicode 字母
- \p{N}- 任何 Unicode 数字
- \p{M}- 变音符号
- \p{Pc}- 连接器标点符号
]- 字符类结束。

注意是\p{Pc}与下划线匹配的类。

NOTE that \p{Alphabetic} (\p{Alpha}) 包括所有匹配的字母\p{L}, plus 字母数字匹配于\p{Nl} (e.g. Ⅻ– 罗马数字的字符12），加上一些其他匹配的符号\p{Other_Alphabetic} (\p{OAlpha}).

其他变化：

/[^\p{L}0-9_]/gu- 只是使用\W仅识别 Unicode 字母
/[^\p{L}\p{N}_]/gu- (PCRE\W样式）即可使用\W只识别 Unicode 字母和数字。

请注意，Java 的(?U)\W将匹配什么的混合\W匹配 PCRE、Python 和 .NET。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

javascript

regex

javascript 正则表达式匹配任何脚本中所有非单词字符的正确正则表达式范围是什么？的相关文章

如何使用 selenium 和 Mocha 获取 xPath() 选择的锚标记的文本

我已经成功选择了 a 标签我想显示锚标记的文本但无法这样做我正在使用 selenium mocha javascript 和 phantomJS 这是我的脚本详细 var assert require assert var test
如何在ASP.NET Webform中使用Jquery表单插件？

我遇到了这个插件 http malsup com jquery form getting started http malsup com jquery form getting started 我想知道如何在 ASP NET WebForm
如何使用 JavaScript 中的值填充下拉列表？

我在 Tridion CMS 扩展中的功能区工具栏按钮中添加了一个按钮单击该按钮后将显示一个弹出页面其中包含两个下拉菜单通过更改第一个下拉控件中的值我应该填充第二个下拉控件的值就我而言我正在使用ASP drop down li
Ember.js 处理 View 事件后转换到路由

Setup 我有一个 Ember 应用程序支持使用 Imgur API 上传图像我已经有一个工作路线和模板来处理任何 Imgur ID 但我想在上传新图像后转换到此路线使用返回的 Imgur ID 这是该应用程序的相关部分 http
检查 touchend 是否在拖动后出现

我有一些代码可以更改表的类在手机上有时表格对于屏幕来说太宽用户将拖动滚动来查看内容但是当他们触摸并拖动表格时每次拖动都会触发 touchend 如何测试触摸端是否是触摸拖动的结果我尝试跟踪dragstart和dragend
javascript中按tab键时如何调用函数？

我有一个这样的功能 function whenEmpty field if field value field style backgroundColor ffcccc alert Please fill the field field f
Google Chrome 106 可拖动导致元素消失

使用拖放元素时绝对定位元素中包含的大多数其他元素都会从屏幕上消失如果我调整窗口大小这些元素会出现但在开始拖动时会再次消失我在最新版本的 Google Chrome 106 和 Beta 版本 107 0 5304 18 以及现在的
如何流式传输 OpenAI 的完成 API？

我想流式传输结果通过 OpenAI 的 API 完成 https beta openai com docs api reference completions 该文档提到使用服务器发送的事件 https developer mozilla
vim 中的正则表达式查找和替换：向数字添加 .0

我有一个如下所示的文件 1 1 0 1 6 1 0 2 8 1 0 3 10 1 0 4 12 1 0 6 如何为所有数字添加 0 后面的数字除外我认为用正则表达式来做到这一点应该不会太难但是我的正则表达式知识太生疏了使用 VIM s
使用 JS 合并具有相同值的相邻 HTML 表格单元格

我已经为此苦苦挣扎了一段时间我有一个根据一些 JSON 数据自动生成的表该数据可能会有所不同我想合并第一列中具有相同值的相邻单元格例如此表中的鱼和鸟 table tr td fish td td salmon td tr tr
淡出和循环一组 div 的最佳方式

假设我有以下 div div class a You are funny div div class b You are smart div div class c You are cool div 最好的展示方式是什么div a持续 5
单击关闭按钮后不显示 Google 一键登录 UI

我正在尝试按照本指南使新的谷歌一键登录工作 https developers google com identity one tap web https developers google com identity one tap web
将 javascript 整数转换为字节数组并返回

function intFromBytes x var val 0 for var i 0 i lt x length i val x i if i lt x length 1 val val lt lt 8 return val func
为什么“tbody”不设置表格的背景颜色？

我在用 tbody 作为 CSS 选择器来设置background color在一个表中我这样做是因为我有多个 tbody 表内的部分它们具有不同的背景颜色我的问题是当使用border radius在细胞上细胞不尊重backgro
当用户单击链接时，如何记录 MixPanel 事件？

当用户单击某种类型的链接时我试图在 MixPanel 中记录一个事件我正在使用 JQuery 不引人注意地完成此操作据我所知我需要添加一个回调函数以便在记录事件后将用户带到 URL 这是我正在使用的代码不幸的是
Nodejs mysql 获取正确的时间戳格式

我在用着mysqljs https github com mysqljs mysql得到结果后sql我变得不同TimeStamp格式如下 created at Sat Jul 16 2016 23 52 54 GMT 0430 IRDT 但
如何获取 UIWebView 中元素的位置？

我在 iPad 程序中加载了 html 的 UIWebView 通过使用 webkit column width 我将 html 分为几列 padding 0px height 1024px webkit column gap 0px we
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
数据表日期范围过滤器

如何添加日期范围过滤器 like From To 我开始进行常规搜索和分页等工作但我不知道如何制作日期范围过滤器我正在使用数据表 1 10 11 版本 My code var oTable function callFilesTable
单击列表时使用 bootstrap Dropdown 防止下拉菜单消失

我正在使用使用引导下拉菜单 http twitter github com bootstrap javascript html dropdowns生成下拉菜单我想防止点击菜单时菜单消失我已经实现了以下代码但它不起作用知道如何修复它吗

随机推荐

使用带有 IN 子句的 query() 进行 CodeIgniter 数据库查询

我的模型中有以下代码 sql SELECT t1 t2 FROM Table1 t1 INNER JOIN Table2 t2 ON t1 id t2 id AND t2 title IN AND t1 type ORDER BY t1 i
将现有数据库与 ASP.NET 5 和 EF7（测试版 7）结合使用

我正在尝试使用 ASP NET 和 EF 7 beta 7 的空模板项目连接到现有数据库这是我的 project json 的样子 webroot wwwroot userSecretsId aspnet5 Titanes2015 409
如何在 JTextArea 中设置文本格式

我正在尝试输出多行文本来创建 ASCII 艺术但是当我使用 JFrame 和 JTextArea 时它无法正确排列我正在尝试打印ASCII 艺术圣诞快乐 https i stack imgur com WSsLh png但是当我在新窗
如何通过redirect()传递验证错误数据？

我有一个包含表单的页面当任何用户提交它时数据都会发送到控制器控制器检查验证如果有任何错误它将用户重定向到上一页包含表单的页面否则它将数据发送到模型要从控制器重定向到上一页如果有任何验证错误我有以下代码 redirect
调整缩放 Gmaps4Rails

我正在使用 Gmaps4Rails gem 无法弄清楚如何调整默认缩放设置在我看来我有以下代码我知道这个问题已经被问过并回答过很多次了但也许我只是没有看到一些东西有什么建议吗我错过了一些完全明显的东西吗我很抱歉重新发布这个问题
为什么 UriInfo.getQueryParameters() 不解码“+”？

我知道我可以解决这个问题但是与从参数映射中提取参数应该根据 javadoc 进行解码相比如果使用带注释的查询参数行为会有所不同这似乎很奇怪这是一个错误还是只是一个怪癖 GET Path Produces MediaType
.htaccess 从 GET 变量重定向到 url 字符串

我需要重定向 search keywords somesearchterm to search somesearchterm 这看起来非常基本但我已经为此绞尽脑汁一个小时了感谢您花时间查看此内容您想使用 mod rewrite 实现所
（ROSE 绘图错误）错误：分面变量必须至少有一个值

我正在尝试使用下面的代码在 R 中绘制每月玫瑰图但遇到错误错误分面变量必须至少有一个值这是我正在使用的数据链接到数据 https www dropbox com s spwpoukrli5p715 test csv dl 0 这段
多线程 Python 中的信号处理

这应该非常简单我很惊讶我在 stackoverflow 上找不到这个问题的答案我有一个类似守护程序的程序需要响应 SIGTERM 和 SIGINT 信号才能与 upstart 良好地配合我读到执行此操作的最佳方法是在与主线程不同的
从数组中返回具有最高值的对象

我想从数组中返回一个属性具有最高值的对象目前我正在做以下事情 Get VM Sort Object Property ProvisionedSpaceGB Select Object Last 1 这可行但效率低下我不需要对整个数组进行
Apache Phoenix - 如何在 Kerberos 集群上启动查询服务器和瘦客户端

我最近花了几天时间尝试通过zookeeper运行phoenix Thin queryserver py和sqlline thin py 和thick以保护集群但是我无法在安全集群上启动或连接phoenix服务在phoenix瘦客户端和
Mongo Atlas：自定义数据库的连接身份验证失败

我正在尝试 Mongo Atlas Cloud 我创建了一个集群并尝试与 mongo shell 连接与 mongo 驱动程序存在同样的问题 mongo mongodb cluster shard 00 00 mongodb net 2
Ruby 读写带有引号的 CSV

我想读取 csv 行更新一个字段然后再次用引号输出该行 Row Example Input gt Joe Blow email protected cdn cgi l email protection Desired Row Examp
Cygwin显示进程的cpu使用情况？

希望这个问题能够得到解决因为我一直在网上寻找答案但没有结果 Cygwin 是否有显示 Windows 进程的 cpu 的命令我知道这个命令top可以显示此信息但它只显示 Cygwin 进程而不显示 Windows 还有另一个命令
GWT (event.getCharCode) 在 IE 和 Firefox 中的行为不同

我正在经历tutorial http code google com webtoolkit doc latest tutorial manageevents html可在 GWT 网站上获取 StockWatcher 应用程序并按照步骤 4
读取文本文件作为资源

我正在尝试从资源中读取文件 words txt 这是一个非常简单但很大 2 MB 的文本文件我想逐行读取它我已将文件放入 res raw words txt 中并尝试使用以下代码打开它 try BufferedReader in ne
获取单元格设置了 WrapText 的行的高度

我正在尝试计算插入到 Excel 工作表中的行的高度该行的单元格格式为WrapText true 所以行的高度不是固定的访问 row Height 将返回 null 我正在考虑使用类似的东西Graphics MeasureString我
RestKit：无法使用 coredata 执行映射

我正在使用rest kit 0 20 3和Xcode 5 如果没有核心数据我可以执行所有rest kit操作但是当我使用核心数据尝试它时我什至无法执行GET由于一些问题我想不通我是核心数据的新手所以请帮忙这是我的代码 AppD
脚本文件中的 mkdir -p 是什么意思？

我在xx sh中发现了这样的一部分脚本 BUILD BOOT mkdir p BUILD BOOT 任何人都可以帮助解释上面的脚本是什么因为目录参数是 p是缩写 parents 它创建直到给定目录的整个目录树例如假设当前目录中没有目录
javascript 正则表达式匹配任何脚本中所有非单词字符的正确正则表达式范围是什么？

在 python 或 PHP 中一个简单的正则表达式例如 W gu匹配任何脚本中的任何非单词字符但在 javascript 中它匹配 A Za z0 9 与 python 和 PHP 匹配相同字符的正确范围是多少 https rege

javascript 正则表达式匹配任何脚本中所有非单词字符的正确正则表达式范围是什么？

javascript 正则表达式匹配任何脚本中所有非单词字符的正确正则表达式范围是什么？ 的相关文章

随机推荐

热门标签

javascript 正则表达式匹配任何脚本中所有非单词字符的正确正则表达式范围是什么？的相关文章