我在用scrapy
关于阿拉伯字母和英文字母。
英文字母完美地工作。
然而,阿拉伯字母显示如下:
gs300 2006 \u0644\u0643\u0632\u0633 \u062c\u064a
有什么帮助吗?我正在使用 python 和 scrapy 0.20.2。
我提取数据的方式是:
site.xpath('my selector').extract()
我像这样从 cmd 调用 json 操作
scrapy crawl dmoz -o items.json -t json
琴弦\u0000
是 Unicode 代码点。每个代表一个字符(例如\u064a
代表yeh http://www.fileformat.info/info/unicode/char/064a/index.htm)。要将这些字符转换为更有用的东西,您将不得不使用encode and decode http://docs.python.org/2/howto/unicode.html正确处理 Unicode 字符串。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)