我想在正则表达式中使用单词边界来匹配一些 unicode 文本。 Unicode 字母在 Python 正则表达式中被检测为单词边界,如下所示:
>>> re.search(r"\by\b","üyü")
<_sre.SRE_Match object at 0x02819E58>
>>> re.search(r"\by\b","ğyğ")
<_sre.SRE_Match object at 0x028250C8>
>>> re.search(r"\by\b","uyu")
>>>
我应该怎么做才能使单词边界符号与unicode字母不匹配?
Use 重新统一码 http://docs.python.org/2/library/re.html#re.UNICODE:
>>> re.search(r"\by\b","üyü", re.UNICODE)
>>>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)