Scrapy 阿拉伯字母返回一些奇怪的东西

2024-04-20

我在用scrapy关于阿拉伯字母和英文字母。

英文字母完美地工作。

然而,阿拉伯字母显示如下:

gs300 2006  \u0644\u0643\u0632\u0633 \u062c\u064a 

有什么帮助吗?我正在使用 python 和 scrapy 0.20.2。

我提取数据的方式是:

site.xpath('my selector').extract()

我像这样从 cmd 调用 json 操作

scrapy crawl dmoz -o items.json -t json

琴弦\u0000是 Unicode 代码点。每个代表一个字符(例如\u064a代表yeh http://www.fileformat.info/info/unicode/char/064a/index.htm)。要将这些字符转换为更有用的东西,您将不得不使用encode and decode http://docs.python.org/2/howto/unicode.html正确处理 Unicode 字符串。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Scrapy 阿拉伯字母返回一些奇怪的东西 的相关文章

随机推荐