我有一个涉及编码/解码的问题。
我从文件中读取文本并将其与数据库(Postgres)中的文本进行比较
比较在两个列表内完成
从文件中我得到“još”的“jo\x9a”,从数据库中我得到相同值的“jo\xc5\xa1”
common = [a for a in codes_from_file if a in kode_prfoksov]
# Items in one but not the other
only1 = [a for a in codes_from_file if not a in kode_prfoksov]
#Items only in another
only2 = [a for a in kode_prfoksov if not a in codes_from_file ]
怎么解决这个问题呢?比较这两个字符串时应该设置哪种编码来解决问题?
谢谢
第一个好像是windows-1250
,第二个是utf-8
.
>>> print 'jo\x9a'.decode('windows-1250')
još
>>> print 'jo\xc5\xa1'.decode('utf-8')
još
>>> 'jo\x9a'.decode('windows-1250') == 'jo\xc5\xa1'.decode('utf-8')
True
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)