我收到错误并显示以下异常消息:
UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in
position 155: ordinal not in range(128)
不知道什么u'\ufeff'
是的,当我抓取网页时它就会出现。我该如何补救这种情况?这.replace()
字符串方法对其不起作用。
我在 Python 3 上遇到了这个问题并发现了这个问题(并且solution https://stackoverflow.com/a/17912811/704616)。
打开文件时,Python 3支持encoding关键字来自动处理编码。
如果没有它,BOM 将包含在读取结果中:
>>> f = open('file', mode='r')
>>> f.read()
'\ufefftest'
给出正确的编码,结果中会省略 BOM:
>>> f = open('file', mode='r', encoding='utf-8-sig')
>>> f.read()
'test'
只是我的2分钱。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)