我一直在寻找一种用 Javascript 处理这些东西的方法。
PHP 有一个处理 unicode 字符的库,称为Unicode 字符属性 http://php.net/manual/en/regexp.reference.unicode.php。基于这些模式,可以通过类似的方式找到 UTF-8 字母preg_match('/^\p{L}+/u', $string)
.
我怎样才能在 JS 中做到这一点?
JavaScript 唯一的 unicode 功能是它可以让你将一个字符与\uDDDD
,所以如果你需要\P{L}
, 没有运气。
然而,史蒂文·莱维森 (Steven Levithan),这本优秀著作的合著者正则表达式食谱(与正则表达式大师 Jan Goyvaerts 一起)有一个名为的替代库XRegExp http://xregexp.com/它还有更多功能,包括您想要的功能。您可以在 RegexBuddy(Jan 的独立应用程序)和RegexPal http://www.regexpal.com/.
引用文档:
XRegExp 支持匹配 Unicode 类别、脚本、块和
通过插件脚本的其他属性。此类令牌的匹配使用
\p{…}、\P{…} 和 \p{^…}。
See XRegExp Unicode 插件 http://xregexp.com/plugins/#unicode.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)