从网站提取数据时,我收到奇怪的字符:
Â
如何删除非扩展 ASCII 字符的任何内容?
可以在这里找到更合适的问题:PHP - 替换所有支持的语言的所有非字母数字字符
正则表达式替换将是最好的选择。使用$str
作为示例字符串并使用它进行匹配:print:
,这是一个POSIX 字符类:
$str = 'aAÂ';
$str = preg_replace('/[[:^print:]]/', '', $str); // should be aA
What :print:
所做的就是查找所有可打印的字符。相反,:^print:
,查找所有不可打印的字符。任何不属于当前字符集的字符都将被删除。
Note:使用此方法之前,必须确保当前的字符集是 ASCII。 POSIX 字符类支持 ASCII 和 Unicode,并且仅根据当前字符集进行匹配。从 PHP 5.6 开始,默认字符集是 UTF-8。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)