从字符串中删除所有特殊字符,不包括非拉丁字符

2024-03-21

我想从字符串中删除除数字和普通 a-z 字符之外的所有特殊字符。

我这样做是这样的:

text = text.replaceAll("[^a-zA-Z0-9 ]+", "");

这种方法的问题在于,它还会删除所有非拉丁字符,如 è、é、ê、ë 等。

我所说的非特殊字符(我想保留的字符)是指所有语言的所有数字和所有字母字符,或者至少是尽可能多的字符。

如何只删除特殊字符?


你可以试试\p{L}对于所有字母和\p{N}对于所有数字:

text = text.replaceAll("[^\\p{L}\\p{N} ]+", "");
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

从字符串中删除所有特殊字符,不包括非拉丁字符 的相关文章

随机推荐