我需要所有字母表的正则表达式。我有一个输入和目标文本。它们都可以属于不同的字母表。我的意思是它们可以属于中文、拉丁文、西里尔文和任何其他字母。
我需要一个用于多语言输入和多语言目标文本的正则表达式。
有人对此有任何想法吗?我该如何编写这个正则表达式?
我将把它与 JavaScript 一起使用。但我认为对于这个问题,java 和 javascript 也应该有通用的正则表达式。
如果您使用 Java(而不是 javascript!),您可以使用 unicode 属性,例如
\P{L}
任何语言的任何类型的信件。
See 正则表达式.info/unicode http://www.regular-expressions.info/unicode.html#prop了解更多信息。
对于 JavaScript:
有一个来自XRegExp http://xregexp.com/和一些插件XRegExp Unicode 插件 http://xregexp.com/plugins/扩展了 javascript 正则表达式功能。这增加了对 Unicode 类别、脚本和块的支持。
有了这些库,您就可以使用\p{L}
使用 JavaScript。
请参阅我的回答这个问题 https://stackoverflow.com/questions/7576945/javascript-regular-expression-for-punctuation-international/7578937#7578937举个小例子
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)