这是我的代码
# -*- coding: utf-8 -*-
import json
import re
with open("/Users/paul/Desktop/file.json") as json_file:
file = json.load(json_file)
print file["desc"]
key="capacità"
result = re.findall("((?:[\S,]+\s+){0,3})"+key+"\s+((?:[\S,]+\s*){0,3})", file["desc"], re.IGNORECASE)
print result
这是文件的内容
{
"desc": "Frigocongelatore, capacit\u00e0 di 215 litri, h 122 cm, classe A+"
}
我的结果是[]
但我想要的是 result = "capacità"
您需要将字符串视为 Unicode 字符串,如下所示:
str = u"Frigocongelatore, capacit\u00e0 di 215 litri, h 122 cm, classe A+"
正如你所看到的,如果你print str.encode('utf-8')
你会得到:
Frigocongelatore, capacità di 215 litri, h 122 cm, classe A+
同样的方式,你可以使你的正则表达式字符串成为unicode或原始字符串u
or r
分别。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)