python–unicodedata用法
需要掌握的
#1、将Unicode字符(chr)转换为等效的数值。以浮点形式返回
print(unicodedata.numeric('四'))#4.0
#2、 将unicode字符(chr)转换为其等效的数字值。以整数形式返回
print(unicodedata.digit('8')) #8
print(unicodedata.digit('h',5)) #5
# print(unicodedata.digit('h') #SyntaxError: invalid syntax
# 3、将unicode字符(chr)转换为其等效的十进制值。以整数形式返回
print(unicodedata.decimal('5')) # 成功,返回5
print(unicodedata.decimal('a', 0)) # 未找到,返回默认值0
# print(unicodedata.decimal('a')) # 未找到,且未指定默认值,所以抛出ValueError异常
#4、返回当前unicod e使用的数据库的版本
unicodedata.unidata_version
了解
# 1、根据name去查找所对应的符号,找不到就报异常
print(unicodedata.lookup('LEFT CURLY BRACKET')) # {
print(unicodedata.lookup('RIGHT CURLY BRACKET')) # }
# 2、根据符号去找name
print(unicodedata.name('!')) # FULLWIDTH EXCLAMATION MARK
print(unicodedata.name('z')) # LATIN SMALL LETTER Z
print(unicodedata.name('\t', 0)) # 未找到对应名称,返回'0'
# print(unicodedata.name('\t')) #ValueError: no such name
# 3、返回字符chr在unicode里分类的类型。具体类型见文档结尾附录1。
print(unicodedata.category("d"))
print(unicodedata.category("8"))
print(unicodedata.category("伍"))
#4、返回字符显示的宽度。具体内容如下:
# F:fullwidth,H:halfwidth,W:wide,Na:narrow,A:ambiguous(不明确),N:natural(正常)
print(unicodedata.east_asian_width('我'))
# 5、判断字符chr是否支持镜像属性,支持则返回1,不支持则返回0
print(unicodedata.mirrored('0')) #0
print(unicodedata.mirrored('王'))#0
#6、将一个可分解的字符chr分成两个16进制的值并返回,如果不可分解,返回空。
print(unicodedata.decomposition('é')) # 可分解
print(unicodedata.decomposition('e')) # 不可分解,所以返回空值(输出就是一片空白)